Mise à jour:
En faisant la requête "site:www.facebook.com/pages" (cliquez ici pour constater par vous-même en haut à droite) sur Google, issue de l'astuce ci-dessous, on trouve exactement 143 millions (en tout cas sur mon écran) de pages ouvertes en mode public qui vont maintenant être indexées en temps réel. Mon estimation était donc bonne!
Billet original:
Inside Facebook et Techcrunch confirment que la marche vers le "Web Instantané" via les réseaux sociaux, récemment annoncée par Google et Microsoft Bing, devient effective.
En effet, Google indexe dès maintenant en temps réel les pages publiques de profil: ce sont toutes ces pages bâties par les stars, les associations, les grandes sociétés, des groupes d'intérêts (le Top30 mondial est ici) qui sont publiques. Un progrès de plus de "l'indexation intégrale instantanée" qui est une des cibles prioritaires de Google dans sa mission à long terme....
Combien y-a-t-il de ces pages ?
En utilisant mon vieux truc personnel pour les compter, on se rend compte que Google connaît à ce moment 476 millions de pages sur facebook.com. Nous sommes officiellement 350 millions de membres avec une page personnelle descriptive (partiellement publique et ce partiellement à notre insu) chacun.
On peut donc déduire qu'il y a aux alentours de 100-120 (476 -325 +/- qq "broutilles") millions de pages que Google va dorénavant tenir à jour dans son index en temps réel.
Google est équipé de 2+ millions de serveurs pour pister 1'000+ milliards d'URL publiques sur le web. Ces 100 millions de pages sont donc pour lui un détail (0.01 %) : on pourrait imaginer qu'il laisse fonctionner ces "aspirateurs à contenu" à leur vitesse maximum sur le site Facebook, mais ce serait mettre un gros stress sur l'infrastructure Facebook qui est petite (30'000 serveurs seulement) en comparaison...
Marissa Mayer de Google confirme donc qu'un dispositif spécial d'alertes instantanées sur les changements dans ces pages est maintenant en place entre les 2 sociétés afin de minimiser la charge côté Facebook. C'est très similaire à ce que Google fait déjà pour les blogs depuis longtemps via RSS pour limiter la charge de travail sur sa propre infrastructure.
Facebook est devenu cet été le 4ème site mondial (futur propriétaire du graphe social global) derrière l'éternel trio de tête GYM (Google, Yahoo, Microsoft) . Puisqu'un trafic massif est essentiel aux (actuels) 500 millions de dollars de revenus de son modèle d'affaires paradoxalement purement publicitaire (à l'heure actuel), les avancées dues à ces progrès d'indexation sont à suivre en détails dans les statistiques des prochains mois!
Source: blog Media & Tech (par didier durand)
Aucun commentaire:
Enregistrer un commentaire