Technorati et Blogpulse
Pour une mission, je navigue pas mal dans les blogs en ce moment, et j'en profite pour mettre à jour mes connaissances sur les principaux moteurs de blogs.
Je viens d'ailleurs de me rendre compte que Technorati et Blogpulse, s'ils "connaissaient" mon blog (certes bien petit à l'échelle de la blogosphère) par quelques-uns plus connus qui ont à un moment pointé dessus, n'indexaient toutefois pas son contenu : ce n'est très certainement pas vrai pour les blogs les plus "populaires", où cela doit se faire automatiquement, mais il s'avère donc qu'il y a un déficit (important ?) entre les blogs comptabilisés par ces moteurs de blogs, et les blogs réellement scrutés. Je me pose donc la question de savoir si j'appartenais ou non aux 24,3 millions de Technorati dont je parlais mardi dernier (d'ailleurs, aujourd'hui, le chiffre indiqué est de 24,8 millions : cela donne quelque peu le vertige !) ou aux 20680582 de Blogpulse à cette heure ??? ... Et bien sur, je vais dans la foulée voir ce que je peux faire pour être dans la course (!) et aussi tester les tags, ce que je voulais faire depuis déjà un bon moment....
Quant au moteur de blogs de Google (http://blogsearch.google.com/ ou http://search.blogger.com/), il indexe déjà mes notes (y'en a au moins un)
Quelques minutes plus tard....
Il semble que cela fonctionne différemment pour Technorati, Blogpulse et Google (ben oui, sinon, ce serait trop simple). Blogpulse, une fois le blog soumis, vient "de lui-même" et donc classiquement voir une fois par jour s'il y a du nouveau (si j'ai bien compris). Quant à Technorati, il faut le "pinger" (voir sur wikipedia la définition d'un "ping"), et on peut même faire de l'"automatic pinging" (on n'arrête pas le progrès, je sens qu'entre la "tagosphère" et l'"automatic pinging", je vais briller à mon prochain dîner ; déjà, à un apéritif samedi soir dernier, la folksonomie a eu pas mal de succès :-))).
Pour Google, en fait, Typepad, que j'utilise, "pinge" automatiquement le service de mise à jour (a "ping server")www.weblogs.com (service créé par Dave winner, l'un des créateurs de RSS, et racheté en octobre 2005 par VeriSign) qu'utilise notamment Google. Donc, cela explique que je n'ai eu aucun travail de référencement à faire dans ce cas.
Sinon, en termes de recherche, un petit récap rapide :
SUR TECHNORATI, trois modes de recherches principaux, bien visibles en cliquant sur "options" (www.technorati.com/search) à partir du formulaire d'accueil.
- Recherche par mot-clé (posts containing this text) sur le texte intégral des notes publiées (possibilité interessante de restreindre la recherche à un blog en particulier ou à un thème - comprenez tag - précis) : on obtient par défaut les derniers posts publiés dans toutes les langues.
- Recherche par url (links to this URL) pour obtenir les blogs qui ont un lien vers cette adresse et les derniers billets concernés. Si le blog en question est assez "connu", et en fonction des informations dont dispose Technorati et que lui a fourni l'éditeur du blog, on obtient alors une présentation avec le "technoraty rank", mesure qui tient compte de la popularité du blog dans la base. Marche aussi sur des liens de billets spécifiques... (rajout le 10/01)
- Recherche sur les "tags" (posts tagged as) , qui ne concerne donc que les notes ayant été "taggées" spécifiquement, ou bien affectées par leurs auteurs à des catégories, et que Technorati puisse reconnaître ces catégories comme des tags (ce qui est le cas pour les systèmes et plate-formes les plus connues). L'onglet Tag depuis la page d'accueil indique quelque 4 millions de tags et les 250 les plus populaires.
Technorati a également créé un répertoire (onglet Blog Finder) dont la classification se fait automatiquement à partir des tags les plus utilisés dans les billets des blogs qui utilisent ce système, ou bien à partir des descripteurs choisis par les éditeurs lorsqu'ils enregistrent directement leur blog. Donc, rien à voir avec le système classique des répertoires de pages web "à la Yahoo" ! - Spécial Veille : Technorati propose aussi aux internautes enregistrés de créer leur "WatchList" (liste de requêtes) pour se tenir au courant des derniers résultats sur leurs recherches favorites, voir bien sur s'abonner au fil RSS généré automatiquement : pratique, non ?
SUR BLOGPULSE (qui rappelons-le appartient à Intelliseek, la société qui développe le méta-moteur web Profusion ), également trois modes de recherche principaux, mais des fonctionnalités complémentaires à celles de Technorati, et des outils de suivi de tendance très sophistiqués
- Recherche par mots-clés : En cliquant sur la recherche avancée, on voit que les fonctionnalités incluent les recherches booléennes, et les recherches par dates, et la possibilité de privilégier un tri par date (par défaut) et un tri par pertinence. BLogpulse bénéficie ici clairement par rapport à Technorati de son expérience sur le marché des méta-moteurs, mais en revanche, ne propose pas de chercher dans la "tagosphère" (j'en profite, maintenant que j'ai du vocabulaire !) à moins que j'ai mal regardé.
- Recherche par URL : comme chez Technorati, en rentrant l'adresse d'un blog dans le formulaire, on obtient les derniers messages "pointant" sur ce blog, avec informations sur chacun des blogs dont sont issus les messages, et la possibilité de "suivre la conversation" (voir ci-après).
- Recherche sur un billet particulier (Link search) :
on va ici plus loinvoir à partir de "Advanced", pour ne voir que les liens consacrés à cette note. - Analyse de tendances BLogpulse donne aussi à voir les termes les plus discutés, qui sont classés et représentés visuellement. On peut générer des graphiques en utilisant le "Trend Search". L'outil propose également des Faits marquants (featured trends), Top blogs, Top links, Key phrases et Key people et un
- Traqueur de conversation ("conversation tracker") qui permet de voir les conversations à partir d'une note par blogs interposés (on retrouve cette fonction pour chaque billet donné en page de résultats) - correspond un peu à la fonction "thread" sur les forums. Notons qu'on a depuis peu également un Blogpulse profile qui permet d'avoir plus d'infos et stats sur un blog en particulier (id, on retrouve cette fonction pour chaque billet)
- Special veille : pour chaque requête, un fil RSS est généré auquel on peut s'abonner (pas de page perso récap comme chez Technorati).
SUR GOOGLE BLOG SEARCH , créé, rappelons-le en juin 2005, on ne connaît pas le nombre de blogs "traqués", mais en tout cas, le moteur n'indexe que les notes publiées depuis cette date, et quelques essais comparatifs montrent que Google se défend en général très bien en nombre de résultats par rapport à ses concurrents (peut-être connaît-il moins de blogs mais les indexe-t-il mieux ?), les dépassant largement sur certains mots.
- La recherche avancée par mots-clés permet de mieux voir les fonctionnalités de recherche, qui sont classiques à Google, mais avec en plus : recherche sur le titre du blog (en direct avec l'opérateur 'inblogtitle'), recherche sur le titre du post ('inposttitle'), recherche par auteur (inpostauthor) que ne proposent d'ailleurs ni Blogpulse, ni Technorati. La recherche par date, comme pour Blogpulse, est supportée, et on peut choisir sa langue parmi 33.
Notons que sur la page de résultats, on peut choisir, comme chez Blogpulse,un tri par date ou par pertinence, et très intéressant, en haut de page, les blogs censés être les plus représentatifs de manière générale par rapport au mot-clé (fonctionnalité non présente sur les autres moteurs). Pas de recherches par tag. - Il n'y a pas de recherche spécifique par URL, mais on peut voir qui pointe sur un blog en utilisant la fonction link: opérationnelle, comme d'ailleurs la fonction site: A noter également l'opérateur blogurl: et sur l'interface de recherche avancée de Blogger, la possibilité de restreindre ses recherches à un blog en particulier
- Spécial veille : Comme ses confrères, Google Blog search permet de s'abonner au fil RSS ou Atom généré pour une requête.
Je me rends compte que ce serait bien d'avoir un tableau récap des fonctions à partir de ces observations, mais je n'ai vraiment plus le temps..
.
Un outil de ping pratique : http://pingomatic.com/
Rédigé par: Sebastien Billard | 09.01.2006 at 15:05
"Recherche sur un billet particulier (Link search) : on va ici plus loin (voir à partir de "Advanced", en ne voyant que les liens consacrés à cette note."
Même technorati propose cette fontionnalité, puisqu'il suffit d'indiquer l'URL du billet ;-)
Rédigé par: Aref | 09.01.2006 at 18:20
Bien sur, je corrige tout de suite...
Rédigé par: Armelle | 10.01.2006 at 06:06
excellent post, bien détaillé, bravo. Me permettez-vous d'y faire référence dans un prochain article ?
Rédigé par: Cyril Klein | 27.01.2006 at 13:20
Bravo pour la liste des fonctionnalités de ces principaux moteurs de recherche de blogs !
J'aurais toutefois un bémol à apporter : tous ces moteurs sont encore en enfance question pertinence et exhaustivité (même approchée de loin). Ma requête test, dans mon domaine ("droit français"), ne donne pas souvent comme résultats les blogs ou les billets que j'attend. Pour l'instant, à mon sens, mieux vaut se faire une liste des meilleurs blogs (et non billets) dans un domaine en allant sur Bloglines ou en cherchant un annuaire de blogs dans ce domaine et se construire ensuite, à partir de là, sa liste à soi et la donner à son logiciel de lecture de fils RSS (dit aussi aggrégateur de fils RSS).
Pour mieux comprendre ce reproche et pour plus de détails, lire mon article (mis à jour avec les références de vos billets :-) :
Google Blog Search : la version bêta n’est pas au point ...
http://www.precisement.org/blog/article.php3?id_article=123
Rédigé par: Emmanuel Barthe | 29.01.2006 at 01:07
Pour répondre à Cyril, euh, oui, évidemment (je suis allée voir ScanBlog, et j'ai adoré la grenouille !).
Emmanuel, je suis entièrement d'accord avec vous et votre article est concluant (entre parenthèses, Technorati et Blogpulse n'indexent toutjours pas mes billets, je ne sais pas pourquoi puisque désormais je les "pingue", il faut que je trouve le temps de me pencher sur le pb, mais ce n'est pas cela qui m'intéresse le plus, et je me dis que je ne suis sans doute pas la seule dans ce cas !!), mais je rajouterai le principe de "navigation sociale" aux moyens de "remplir" efficacement son agrégateur. En bref, vive la "logique sources" !
Rédigé par: Armelle | 29.01.2006 at 19:10