Accéder au contenu principal

OSWIR 2005

OSWIR 2005 (2005 workshop on Open Source Web Information Retrieval) organisé par Ecole Nationale Superieure des Mines de Saint-Etienne et l'Illinois Institute of Technology s'est tenu le 19 Septembre dernier à Compiègne. Les papiers, dont un de Doug Cutting (Nutch: an Open-Source Platform for Web Search [en/pdf]) sont diponibles en ligne.

Commentaires

Posts les plus consultés de ce blog

Installation de Nutch 0.8.1 sous Ubuntu 6.10

Merci à Arnaud Goupil alias Arnonymous pour son très bon tutoriel en français sur l' Installation de Nutch sous Ubuntu . Pour les anglophones, je vous conseille également de lire ce très intéressant billet de Sami Siren (contributeur très actif à Nutch) où il est question, grâce à la compression de données, de gagner en espace de stockage, MAIS également en temps de traitement CPU...

Nutch-0.7.2

La version 0.7.2 de Nutch est disponible. Cette version contient uniquement des corrections de bugs. Voici la liste des modifications: NUTCH-107 - Correction d'erreurs de syntaxe dans les fichiers plugin.xml des plugins urlfilter-* (Stephen Cross). NUTCH-141 - Tag title non valide dans les pages jsp (Marko Bauhardt). Correction de problèmes de compilation dus à des répertoires vides dans des plugins. NUTCH-142 - NutchConf utilise maintenant le classloader de son thread. (Mike Cannon-Brookes). NUTCH-45 - SegmentMergeTool loggue maintenant les segments corrompus. (Otis Gospodnetic). Correction des test unitaires de TestFetcher qui échouaient à cause de changements sur le site web www.nutch.org /li> NUTCH-91 - Exceptions dues à un encodage vide. (Michael Nebel). Mise à jour de la librairie Lucene à la version 1.9.1. Librairie Commons HTTPClient mise à jour à la version 3.0. Ignore les liens "post" et "nofollow...

Frutch? C'est quoi ce truc?

Dans des temps déjà anciens (Mai 2005), je parlais sur motrech d'une interview que j'avais donné à Olivier Andrieu concernant Frutch . Olivier Andrieu m'a aujourd'hui autorisé, et je l'en remercie encore, à maintenant publier ici l'intégralité de l'interview. Cela permettra, je pense, de clarifier certains points sur ce qu'est Frutch et ce qu'il n'est pas. Jérôme Charron, à l'origine de nombreuses initiatives dans le domaine de la recherche d'information sur le Web francophone depuis de nombreuses années, a lancé un projet baptisé "Frutch" , basé sur la mise en place d'un moteur de recherche "Open Source" pour le monde de la francophonie. Il nous en dit plus, dans cet interview, sur ce projet... Déjà initiateur de la liste de discussion Motrech en 1998, puis d'un blog et d'un Wiki sur le sujet, auteur d'une thèse ayant pour sujet "Méthodes et outils d'exploration multilingue sur internet...