Accéder au contenu principal

Installation de Nutch 0.8.1 sous Ubuntu 6.10


Merci à Arnaud Goupil alias Arnonymous pour son très bon tutoriel en français sur l'Installation de Nutch sous Ubuntu.

Pour les anglophones, je vous conseille également de lire ce très intéressant billet de Sami Siren (contributeur très actif à Nutch) où il est question, grâce à la compression de données, de gagner en espace de stockage, MAIS également en temps de traitement CPU...

Commentaires

Anonyme a dit…
le lien vers le tutorial est http://goupil.arnaud.free.fr/nutch.php et pas http://goupil.arnaud.free.fr/nutch.html

:) et bonne annee
Anonyme a dit…
Oups, c'est ma faute.
J'ai re-créé nutch.html qui redirige vers la bonne page.
Bonne année !
Anonyme a dit…
Bonjour,
je represente une enteprise Français (CELI France) qui est actuellment en train de developper un moteur de recherche pour le français dans le cadre d'un projet de recherche et d'un projet open source. On cherche quelqu'un avec des competance nucth/lucene/SOLR pour travallier sur ce projet et eventuellement integrer le personnell de l'enteprise. Pour se renseigner sul la nature de CELI france vois www.celi-france.com et www.celi.it
Anonyme a dit…
Pardon j'ai oublié mon addresse email : dini@celi-france.com

Posts les plus consultés de ce blog

Rencontre entre Nutchies

Avis aux Francopho Nutchies, le Jeudi 18 Mai prochain aura lieu vers 19:00 une rencontre entre les utilisateurs de Nutch . Vous êtes donc tous conviés à venir participer à cette rencontre qui se déroulera Cafe Du Soleil , 200 Fillmore Street, San Francisco, CA (voir la carte ). Oui, je sais, San Francisco ce n'est pas la porte à côté, mais au moins, les problèmes de visa pour les Etats-Unis semblent être de l'histoire ancienne, c'est déjà ça! C'est une bonne occasion pour rencontrer Doug Cutting ou Stefan Groschupf . Alors, si vous êtes intéressé, l' invitation officielle est ici .

Nutch-0.7.2

La version 0.7.2 de Nutch est disponible. Cette version contient uniquement des corrections de bugs. Voici la liste des modifications: NUTCH-107 - Correction d'erreurs de syntaxe dans les fichiers plugin.xml des plugins urlfilter-* (Stephen Cross). NUTCH-141 - Tag title non valide dans les pages jsp (Marko Bauhardt). Correction de problèmes de compilation dus à des répertoires vides dans des plugins. NUTCH-142 - NutchConf utilise maintenant le classloader de son thread. (Mike Cannon-Brookes). NUTCH-45 - SegmentMergeTool loggue maintenant les segments corrompus. (Otis Gospodnetic). Correction des test unitaires de TestFetcher qui échouaient à cause de changements sur le site web www.nutch.org /li> NUTCH-91 - Exceptions dues à un encodage vide. (Michael Nebel). Mise à jour de la librairie Lucene à la version 1.9.1. Librairie Commons HTTPClient mise à jour à la version 3.0. Ignore les liens "post" et "nofollow"