La version 0.7.1 de Nutch est disponible. Cette version contient uniquement des corrections de bugs.
Voici la liste des modifications:
Voici la liste des modifications:
- Le champ de recherche dispose maintenant du focus.
- Correction d'un nom de cible erronné dans
plugin/build.xml
. - NUTCH-10, les points d'extension ne sont définis qu'une fois.
- Ajout d'un utilitaire d'extraction d'URLs dans du contenu textuel.
- Quelques mises à jours mineurs dans le module d'indentification de la langue.
- NUTCH-37, correction des multiples warnings lors de la construction de la javadoc.
- La propriété
indexer.maxMergeDocs
vaut maintenant par défaut2147483647
. Cette valeur par défaut avait été positionnée à50
par erreur, ce qui a pour conséquence de ralentir énormément l'indexation. - Modifications du plugin de clustering.
- Les composants Carrot2 ont été mis à jour (dernières versions stables): Amélioration des tokenizers (performances) et de la gestion de stop-words. Ajout du support du Danois, du Finlandais, du Norvégien et du Suédois.
- PDFBox mis à jour à la version 0.7.2. (corrige NUTCH-85).
- NUTCH-89, null pointer exception dans parse-rss.
Commentaires