« Webnote : Les notes partagées sur le web | Accueil | Kaliwatch Pro inexistant sur le site d'Arisem ? »

18.10.2004

Les principaux outils de recherche blogs et fils RSS

Je viens de faire le point pour un prochain cours des outils de recherche francophones sur les blogs et les fils RSS. Ci-après le résultat des courses (il semble rester de la place pour un moteur francophone digne de ce nom !), sachant que ce n'est certainement pas exhaustif (les compléments sont les bienvenus). Sur les outils internationaux, voir aussi la liste "Aripaparo"

A/ Outils internationaux (mais majoritairement anglophones)

1/ Répertoires et listes internationales

Blogarama www.blogarama.com
20100 blogs listés (7850 en février 2004) avec un "vrai" système de catégories (avec arborescence). Recherche sur les descriptifs (avec le AND, le OR, et les guillemets disponibles) et recherche avancée disponible.

Eaton web http://portal.eatonweb.com/
20800 blogs (16400 en février) environ repertoriés sur ce site . Les catégories sont en fait des mots-clés préproposés. On peut aussi avoir une liste par ordre alphabétique, par pays et par langue + moteur mots-clés sur les descriptifs.

Newsisfree http://www.newsisfree.com
14000 sources (8200 en février). Répertoire de sources par catégories : http://www.newsisfree.com/sources/bycat/ : on peut aussi chercher sur les noms et descriptions des blogs.
On peut aussi choisir d'avoir les derniers articles par catégories. Egalement moteur sur les derniers "posts" récupérés (voir ci-dessous dans "moteurs internationaux" ).

Syndic8.com http://www.syndic8.com
Liste par ordre alphabétique (environ 80000 sources, 28000 en février 2004), par catégories (pas très utilisable), et recherche par mots-clés.
Liste pour la France (non complète, néanmoins) :
http://www.syndic8.com/feedlist.php?ShowLanguage=fr&ShowStatus=all
Des fils RSS sont ajoutés, voire créés sur proposition des internautes. Dans la liste, un fil orange émane directement du producteur. Un fil bleu a été "forgé" ("scraped" par Newsisfree)

Weblogs.com http://www.weblogs.com/ Blogs récemment (dans les trois heures) mis à jour : on peut s'abonner au fil RSS correspondant.

2RSS.com http://www.2rss.com/
Un nouveau repertoire qui traite actuellement quelque 7800 fils.


2/ Moteurs internationaux

Blogpulse www.blogpulse.com
Mis en ligne en mai 2004 par la société Intelliseek. Moteur de blog (avec fonctionnalités de recherche avancées) et permettant également de voir les termes les plus discutés, qui sont classés (graphiques). On peut générer des graphiques en utilisant le "Trend search"
Blogpulse propose également un classement des Top links, Key phrases et Key people, avec pour ce dernier un baromètre des positions.

Bloogz – Worl Wide blogs http://www.bloogz.com/ Originellement italien, le moteur Bloogz permet aujourd'hui une recherche également en français, anglais, espagnol, italien et allemand. Le nombre de blogs pris en compte n'est pas indiqué, mais les éditeurs peuvent "référencer" leur blog. On peut choisir un tri par pertinence ou par date.
Nouveauté : "Blogs popularity index" (en fonction du nombre de visiteurs et de citations) et Agrégateur Rss disponible gratuitement en ligne

Daypop http://www.daypop.com Capacité de recherche dans quelque 60.000 sources (même chiffre annoncé en février 2004) utilisant le format RSS (35000 en octobre 2003) : sites de news, weblogs et "fils" RSS". Recherche avancée permet de chercher par pays et par langue. On a le "post" en cache et les citations sur le blog dans la liste des résultats.
A note la fonction link: pour savoir qui pointe sur un blog (par rapport à l'index de Daypop)
Blogstats pour avoir les statistiques de popularité d'un blog

Feedster http://www.feedster.com
Moteur spécialisé dans la recherche sur les weblogs et fils rss (800.000 sources et 5000 nouvelles par jour ! pour 446.000 en février), nés de la fusion de Feedster avec RSS Search : fonctionnalités évoluées de recherche. Basiquement, on choisit des résultats triés par pertinence ou par date.
On peut créer un fil RSS à partir d'une recherche par mots-clés
Possibilité d'avoir une visualisation graphique des provenances des résultats (carte du monde).
"My Feedster" permet de syndiquer son contenu en ligne gratuitement, en sauvegardant des posts et des recherches.
Nouveau : possibilité de savoir qui pointe sur un blog (par rapport à l'index de Feedster, bien sûr).

Newsisfree http://www.newsisfree.com
14000 sources. Recherche par mots-clés des articles récupérés dans les deux derniers jours. Formulaire permettant de choisir entre le Et et le Ou entre les mots, le tri de pertinence et la langue. Une recherche par catégories est également disponible (cf ci-dessus).

Technorati www.technorati.comPlus "moteur de popularité" que moteur de recherche, Technorati est l'un des premiers outils à avoir scruté la "blogosphère" (actuellement environ 4300000 weblogs surveillés et 650000000 posts) selon cet axe. Le moteur d'avoir une liste de blogs qui ont fait un lien vers une source donnée (site web, blog ou article). Inutile de mettre http:// ou même www, l'outil les rajoute automatiquement.

Waypath www.waypath.com
Ce nouveau moteur (oct 2004) permet de faire une recherche sur le contenu de trois millions de blogs, avec des fonctions avancées (opérateurs, proximité, etc.)
L'outil propose par ailleurs l'agrégation de différents blogs traitant du même sujet.
Une fonctionnalité à retenir : le bouton "Waypath it!" en bas à droite de chaque résultat vous permet trouver les posts ayant un sujet proche (qui donne d'ailleurs lieu à un bookmaklet pour faire de même en cours de navigation.

B/ Outils francophones

1/ Répertoires francophones

Blogonautes www.blogonautes.com
Répertoire de blogs francophones (Annublog, cité dans l'article, renvoie désormais sur Blogonautes) : il annonce actuellement 3922 weblogs ( 2470 en février) et offre une recherche multicritères : nom de l'auteur du blog, pays et ville d'origine, sexe et tranche d'âge (attention, selon les déclarations du blogueur lui-même), mots-clés (recherche sur la description du blog). On peut trier les résultats par différents critères.
Pas de classement hiérarchique des weblogs.
La page d'accueil permet de voir les nouveautés sur les blogs répertoriés (fil RSS d'ailleurs).

BlogArea http://www.blogarea.net/Encore un annuaire avec 379 blogs référencés, et 20 catégories pour 43 sous-catégories.

Blogolist http://blogolist.com Ce répertoire francophone indexe environ 740 blogs (600 en février) en permettant une recherche par origine géographique. Recherche dans les url, les titres, les descriptions, les mots-clés (une liste de mots-clés est proposée). Pas de classement hiérarchique des blogs. Blogs récemment mis à jour, articles et blogs les plus cités

Les pages joueb http://pages.joueb.com636 blogs (id en février, c'est inquiétant !) classés par mots-clés.

Retronimo www.retronimo.comAnnuaire de fils RSS (650 actuellement + 83 flux "exclusifs" générés pour des sites ne proposant pas de fils RSS + quelques flux thématiques associés à un moteur de recherche sur le "fond documentaire" ainsi constitué), de blogs (URL directe www.retronimo.com/blog ), et métamoteur de blogs (URL directe www.retronimo.com/bse )

RssReporter http://www.rssreporter.net/html/
Un petit nouvel annuaire de fils RSS ou Atom (actuellement 246 sites recensés) qui comporte une vraie arborescence (certes encore un peu pauvre !)

Weblogues.com http://www.weblogues.com/ Ex-Moteur spécialisé sur les blogs francophones avec recherche intégrale sur le texte des "billets", Weblogues a restreint son ambition en devenant un outil de repérage des blogs (quelque 35280 weblogs, 4500 en février, 2500 en octobre 2003)..
On peut rechercher sur la description des blogs, ou par une liste de mots-clés assez anarchique. La page s'ouvre sur les blogs mis à jour, ce qui constitue d'ailleurs un fil RSS auquel on peut bien sûr s'abonner.


2/ Moteurs francophones

Easy RSS http://www.easyrss.com/ moteur de recherche de fils RSS (actuellement 130400 fils indexés environ) lancé par deux bruxellois avec l'objectif ambitieux de devenir "le premier portail RSS européen".

Commentaires

Petit souci sur le premier lien (Blogorama).

Merci, c'est réparé...

Dans la catégorie répertoire, vous pouvez aussi citer Paname Ensemble, même si c'est un répertoire particulier puisque fonctionnant à partir d'une carte des stations de métro et de RER de Paris et d'Ile de France.

http://www.paname-ensemble.com

Mais c'est vrai ce n'est pas que cela non plus, et c'est plus un jeu qu'un vrai répertoire...

dans la serie des moteurs de recherche sur les retroliens, il y a aussi blogdex - une initiative du Mit Media Laboratory.

http://blogdex.net/

Hum, un autre annuaire de fils RSS francophones:
http://pretty-rss.snyke.com/Annuaire_RSS/Annuaire_RSS.html

Excellente page - complète et surtout très compréhensible - Robert

Pour une recherche visuelle et selection par critère graphique (design):
http://kaleibloscope.snyke.com/

un autre site qui fait a la fois moteur de recherche et répertoire:

http://www.newsg8.com

Bonjour,

Je voulais juste vous dire que votre blog n'inclue pas le seul aggregateur de flux RSS en anglais et francais: www.stepnewz.com. Ce dernier a recense plus de 300,000 articles de flux rss (je suis l'un des co-fondateurs).

nicolas bussard

PS: Votre article est une education intelligente

Ce commentaire tient lieu de trackback manuel vers ce billet que j'ai posté dernièrement :
http://www.pascal-grouselle.net/blog/?2005/07/31/62-trouver-avec-google-des-billets-recemment-dans-des-blogs

Voici un site internet qui vous permet de rechercher sur wikipedia, et de traduire les articles en francais (il y a 4 fois plus d'articles en anglais qu'en francais). ce moteur de recherche permet d'indexer le contenu de ces informations.
http://www.qwika.com/find-fr

Vérifiez votre commentaire

Aperçu de votre commentaire

Ceci est un essai. Votre commentaire n'a pas encore été déposé.

En cours...
Votre commentaire n'a pas été déposé. Type d'erreur:
Votre commentaire a été enregistré. Poster un autre commentaire

Le code de confirmation que vous avez saisi ne correspond pas. Merci de recommencer.

Pour poster votre commentaire l'étape finale consiste à saisir exactement les lettres et chiffres que vous voyez sur l'image ci-dessous. Ceci permet de lutter contre les spams automatisés.

Difficile à lire? Voir un autre code.

En cours...

Poster un commentaire

Outils de veille : Recherche Google