jeudi, mars 02, 2006

Google: maintenant 200'000 serveurs mais sur AMD

Lors du lancement de Google Sitemaps, je définissais ce service comme un moyen d'accélérer la "machine tentaculaire Google" afin que les 100'000+ serveurs qui reconstruisent en permanence son monstrueux index puissent le garder à jour malgré un contenu nouveau chaque jour plus abondant (en particulier à cause de la blogosphère).

Eh bien, cette optimisation de l'infrastructure via SiteMaps n'a visiblement pas suffi (on s'en serait douté...): Google a dû installer depuis le mois d'Avril 2004 100'000 nouveaux serveurs pour faire face à cette explosion des pages de l'Internet. En effet, le Los Angeles Times annonce que la taille de l'infrastructure de Google est maintenant de 200'000 serveurs.

Le LA Times donne aussi le nom
de celui qui se frotte les mains de cette croissance matérielle effrénée: c'est AMD qui vient de chiper le client Google à son concurrent Intel. En effet, dorénavant, les machines utilisées par Google seront équipées de puces AMD au lieu de Intel.

Un bon coup marketing en retour de celui que Intel lui a fait avec Skype!

Voilà, maintenant que l'on a 2 points de repère distants de quelques moins, on se revoit dans quelques temps avec une troisième information de taille pour voir si la progression de la taille de cette infrastructure est linéaire ou exponentielle!

PS1: pour Google, il faut je pense plutôt parler de machines que de serveurs car la philosophie est d'utiliser une nuée de petites machines à moins de 1'000 dollars plutôt que moins de "serveurs monstres" beaucoup plus coûteux. Cette architecture basée sur une multitude de petites machines (et sur une version de Linux spécialement modifiée par Google) est superbement décrite dans un papier de 2003 que les ingénieurs Google ont présenté à une conférence IEEE: elle a été retenue pour ses avantages financiers et son ration énergie-performances plus favorable.

PS2: en utilisant les chiffres de ce papier IEEE, on pourrait presque commencer le calcul évoqué ci-dessus puisque, en Mars 2003 (date de publication), le papier parle d'une infrastructure de 15'000 machines. On va attendre encore un peu avant de mettre cela sur un beau graphique...

PS3: je suis personnellement fasciné par une infrastructure de cette taille. J'ai personnellement déjà géré plusieurs centaines de serveurs: c'était "chaud"! A 200'000, je n'ose même pas imaginer le niveau d'automatisation / de clonage qu'il faut atteindre pour s'en sortir à un niveau de coût raisonnable.

3 commentaires:

Clément a dit…

200 000 serveur, c'est fénomenale que l'on arrive a faire marcher tout ca ensemble...

Anonyme a dit…

bonjour;
combien d'energie consomme tous ses clusters pour fonctionner et surtout pour refroidir (clim en salle machine) ?

j'ai lu un papier sur le centre de
calcul du CEA (mis en place par BULL) 5000 machines: si la clim tombe en panne, la température s'éléve de 1°C toutes les 10 minutes .

Bonne journée.

Anonyme a dit…

Bonjour,

Merci de l'info

PS: j'ai un nouveau billet : Google est maintenant à 450'000 serveurs

Voir http://media-tech.blogspot.com/2006/06/avec-ses-450000-serveurs-google-est.html