Accéder au contenu principal

Installation de Nutch 0.8.1 sous Ubuntu 6.10


Merci à Arnaud Goupil alias Arnonymous pour son très bon tutoriel en français sur l'Installation de Nutch sous Ubuntu.

Pour les anglophones, je vous conseille également de lire ce très intéressant billet de Sami Siren (contributeur très actif à Nutch) où il est question, grâce à la compression de données, de gagner en espace de stockage, MAIS également en temps de traitement CPU...

Commentaires

Anonyme a dit…
le lien vers le tutorial est http://goupil.arnaud.free.fr/nutch.php et pas http://goupil.arnaud.free.fr/nutch.html

:) et bonne annee
Anonyme a dit…
Oups, c'est ma faute.
J'ai re-créé nutch.html qui redirige vers la bonne page.
Bonne année !
Anonyme a dit…
Bonjour,
je represente une enteprise Français (CELI France) qui est actuellment en train de developper un moteur de recherche pour le français dans le cadre d'un projet de recherche et d'un projet open source. On cherche quelqu'un avec des competance nucth/lucene/SOLR pour travallier sur ce projet et eventuellement integrer le personnell de l'enteprise. Pour se renseigner sul la nature de CELI france vois www.celi-france.com et www.celi.it
Anonyme a dit…
Pardon j'ai oublié mon addresse email : dini@celi-france.com

Posts les plus consultés de ce blog

Nutch-0.7.2

La version 0.7.2 de Nutch est disponible. Cette version contient uniquement des corrections de bugs. Voici la liste des modifications: NUTCH-107 - Correction d'erreurs de syntaxe dans les fichiers plugin.xml des plugins urlfilter-* (Stephen Cross). NUTCH-141 - Tag title non valide dans les pages jsp (Marko Bauhardt). Correction de problèmes de compilation dus à des répertoires vides dans des plugins. NUTCH-142 - NutchConf utilise maintenant le classloader de son thread. (Mike Cannon-Brookes). NUTCH-45 - SegmentMergeTool loggue maintenant les segments corrompus. (Otis Gospodnetic). Correction des test unitaires de TestFetcher qui échouaient à cause de changements sur le site web www.nutch.org /li> NUTCH-91 - Exceptions dues à un encodage vide. (Michael Nebel). Mise à jour de la librairie Lucene à la version 1.9.1. Librairie Commons HTTPClient mise à jour à la version 3.0. Ignore les liens "post" et "nofollow...

Frutch? C'est quoi ce truc?

Dans des temps déjà anciens (Mai 2005), je parlais sur motrech d'une interview que j'avais donné à Olivier Andrieu concernant Frutch . Olivier Andrieu m'a aujourd'hui autorisé, et je l'en remercie encore, à maintenant publier ici l'intégralité de l'interview. Cela permettra, je pense, de clarifier certains points sur ce qu'est Frutch et ce qu'il n'est pas. Jérôme Charron, à l'origine de nombreuses initiatives dans le domaine de la recherche d'information sur le Web francophone depuis de nombreuses années, a lancé un projet baptisé "Frutch" , basé sur la mise en place d'un moteur de recherche "Open Source" pour le monde de la francophonie. Il nous en dit plus, dans cet interview, sur ce projet... Déjà initiateur de la liste de discussion Motrech en 1998, puis d'un blog et d'un Wiki sur le sujet, auteur d'une thèse ayant pour sujet "Méthodes et outils d'exploration multilingue sur internet...