Depuis que Yahoo a (discrètement) annoncé que son index de pages Web avait avec plus de 19 milliards de page largement dépassé celui de Google (toujours annoncé aux alentours des 8 milliards), une immense polémique a fait rage sur le sujet "does size matter?": tout le monde s'y est met (sauf Google à ma connaissance):
- Les Yahoos avec J. Zawodny en tête qui défend le travail de son employeur
- Les MSNers avec Ken Moss qui donne la vision de Microsoft sur le sujet
- Les universités avec l'étude NCSA de l'université de Urbana-Champaign (qui se désolidarise progressivement du sujet...)
Toute la saga est abondamment décrite dans les 5 posts (1, 2, 3, 4, 5) (à ce jour - peut-être d'autres à venir....) hyper-détaillés de Jean Veronis sur le sujet (sa valeur ajoutée lui a même value une citation dans NYT).
Mon humble conclusion personnelle de toutes ces lectures:
- La taille d'un index web n'est pas une fin en soi
- Mais, elle reste incontournable pour atteindre la pertinence qui est le but de tout moteur de recherche digne de ce nom
En effet, comment livrer les meilleurs documents si on ne les connaît pas tous ? Bien sûr, un bon moteur aura un index un peu plus petit qu'un "index maximum brut" puisqu'il aura pris soin d'élaguer tout le spam...
Aucun commentaire:
Enregistrer un commentaire