Yahoo : 19 milliards de pages ?
par Jean Véronis
jeudi 11 août 2005
Nouvel épisode dans la guerre des moteurs : Yahoo ! a annoncé discrètement que son moteur indexait désormais 19,2 milliards de pages... C’est nouveau dans la stratégie de la firme, qui jusqu’ici ne communiquait pas sur la taille de son index. Google, lui, annonce toujours environ 8 milliards de pages sur son écran d’accueil.
Faut-il croire ces chiffres ? Les lecteurs assidus de ce blog auront remarqué que depuis quelques mois je ne parle plus trop des tailles d’index annoncées par les moteurs de recherche : j’ai amplement montré que les moteurs nous racontent ce qu’ils veulent et peuvent bidonner les chiffres à leur convenance (voir à propos de Google, Yahoo, MSN).
Certains, comme Google, nous prennent vraiment pour des boeufs, et ne se soucient même pas de la cohérence interne de leurs chiffres. Ainsi, alors que l’annonce sur la page d’accueil de Google reste quasi identique, les nombres de résultats retournés par les requêtes progressent de façon substantielle. En utilisant mes listes habituelles de requêtes-types, je constate que les nombres de résultats annoncés par Google sur les requêtes ont progressé de 75% pour l’anglais et de 8% pour le français depuis mars (ce qui pourrait confirmer l’impression que Google se concentre sur le monde anglophone, impression dont j’ai déjà fait part). Dans le même temps, la page d’accueil de Google n’est passée que de 8 058 044 651 à 8 168 684 336... Cherchez l’erreur !
Yahoo est plus soucieux de sa cohérence. Les résultats des requêtes individuelles ont été multipliés par un peu plus de 3 pour l’anglais entre mars et août, et par 2,7 pour le français :
Ces chiffres sont compatibles avec l’annonce de 19,2 milliards de pages indexées. En effet, en mars, j’estimais la taille vraie de l’index Google à 5,5 milliards de pages, et celle de l’index Yahoo à au moins cette taille
et sans doute un peu plus. Disons 6 milliards. Une multiplication par 3 à partir de cette base hypothétique donne 18 milliards pour Yahoo en août, ce qui est bien l’ordre de grandeur annoncé.
Il est intéressant de comparer les nombres de résultats retournés par Yahoo et par Google. En mars, j’ai montré qu’ils étaient comparables (en fait légèrement supérieurs pour le français avec Yahoo). A la date d’aujourd’hui, l’écart s’est fortement creusé. Les comptes retournés par Yahoo sont près de trois fois plus grands pour l’anglais que ceux de Google et plus de quatre fois pour le français (ce qui semble confirmer les différences géostratégiques des deux moteurs). Les internautes français utilisent massivement Google (beaucoup plus que les américains), mais ils ont peut-être tort...
Tout cela est bien sûr à prendre avec prudence. Pour l’instant je n’ai pas réussi à surprendre Yahoo en flagrant délit de bidonnage, mais il se peut simplement qu’ils soient plus malins avec les chiffres que leurs concurrents ;-)