Accéder au contenu principal

Nutch-0.7.1

La version 0.7.1 de est disponible. Cette version contient uniquement des corrections de bugs.
Voici la liste des modifications:
  • Le champ de recherche dispose maintenant du focus.
  • Correction d'un nom de cible erronné dans plugin/build.xml.
  • NUTCH-10, les points d'extension ne sont définis qu'une fois.
  • Ajout d'un utilitaire d'extraction d'URLs dans du contenu textuel.
  • Quelques mises à jours mineurs dans le module d'.
  • NUTCH-37, correction des multiples warnings lors de la construction de la .
  • La propriété indexer.maxMergeDocs vaut maintenant par défaut 2147483647. Cette valeur par défaut avait été positionnée à 50 par erreur, ce qui a pour conséquence de ralentir énormément l'indexation.
  • Modifications du plugin de .
  • Les composants ont été mis à jour (dernières versions stables): Amélioration des tokenizers (performances) et de la gestion de stop-words. Ajout du support du Danois, du Finlandais, du Norvégien et du Suédois.
  • mis à jour à la version 0.7.2. (corrige NUTCH-85).
  • NUTCH-89, null pointer exception dans parse-rss.
Nutch-0.7.1 [tar.gz, 45Mo] est disponible ici.

Commentaires

Posts les plus consultés de ce blog

Installation de Nutch 0.8.1 sous Ubuntu 6.10

Merci à Arnaud Goupil alias Arnonymous pour son très bon tutoriel en français sur l' Installation de Nutch sous Ubuntu . Pour les anglophones, je vous conseille également de lire ce très intéressant billet de Sami Siren (contributeur très actif à Nutch) où il est question, grâce à la compression de données, de gagner en espace de stockage, MAIS également en temps de traitement CPU...

Rencontre entre Nutchies

Avis aux Francopho Nutchies, le Jeudi 18 Mai prochain aura lieu vers 19:00 une rencontre entre les utilisateurs de Nutch . Vous êtes donc tous conviés à venir participer à cette rencontre qui se déroulera Cafe Du Soleil , 200 Fillmore Street, San Francisco, CA (voir la carte ). Oui, je sais, San Francisco ce n'est pas la porte à côté, mais au moins, les problèmes de visa pour les Etats-Unis semblent être de l'histoire ancienne, c'est déjà ça! C'est une bonne occasion pour rencontrer Doug Cutting ou Stefan Groschupf . Alors, si vous êtes intéressé, l' invitation officielle est ici .

Nutch-0.7.2

La version 0.7.2 de Nutch est disponible. Cette version contient uniquement des corrections de bugs. Voici la liste des modifications: NUTCH-107 - Correction d'erreurs de syntaxe dans les fichiers plugin.xml des plugins urlfilter-* (Stephen Cross). NUTCH-141 - Tag title non valide dans les pages jsp (Marko Bauhardt). Correction de problèmes de compilation dus à des répertoires vides dans des plugins. NUTCH-142 - NutchConf utilise maintenant le classloader de son thread. (Mike Cannon-Brookes). NUTCH-45 - SegmentMergeTool loggue maintenant les segments corrompus. (Otis Gospodnetic). Correction des test unitaires de TestFetcher qui échouaient à cause de changements sur le site web www.nutch.org /li> NUTCH-91 - Exceptions dues à un encodage vide. (Michael Nebel). Mise à jour de la librairie Lucene à la version 1.9.1. Librairie Commons HTTPClient mise à jour à la version 3.0. Ignore les liens "post" et "nofollow"