Les grappes de PC défient les supercalculateurs

Mobilité

En reliant en réseau sous Linux des centaines d’ordinateurs bon marché, les universités et les entreprises obtiennent, à moindre coût, la même puissance de calcul qu’à l’aide des supercalculateurs des grands constructeurs. La fin d’un règne ?

Pendant longtemps, la puissance des supercalculateurs s’est mesurée à l’aune du nombre d’opérations en virgule flottante par seconde (flop en anglais) réalisées par leurs processeurs. Aujourd’hui, d’autres chiffres viennent bousculer l’ordre établi avec l’avènement des parcs d’ordinateurs en réseau. Des configurations dites « en grappe » rassemblent 32, 128, 258 ou 580 machines semblables à la vôtre. Cumulant leur puissance, elles atteignent à bon prix celle de machines estimées à plusieurs millions de dollars.

Leur présence est encore discrète, mais ces réseaux de PC ont permis aux chercheurs américains du Sandial Lab de décrocher la 44ème place du top 500 des supercalculateurs de la planète (voir édition du 23 novembre 1999). La prouesse a été suivie par l’université de Los Alamos, qui obtient une 265ème place honorable avec 140 machines.

Les sceptiques rétorqueront que la majorité des places du Top 500 sont encore occupées par les supercalculateurs des ténors IBM, Hewlett-Packard, SGI, Nec ou Fujitsu. Mais une véritable révolution est amorcée. En France, la société Alinka a dévoilé récemment l’une des premières applications permettant à une entreprise ou un laboratoire de recherche de construire son propre réseau de calcul en grappe (cluster) sous Linux. « En deux heures, on peut installer Linux sur tous les postes de calcul, en s’aidant d’une disquette de démarrage et d’un PC maître pour cloner le système d’exploitation », explique Benjamin Levy, co-fondateur et responsable commercial d’Alinka. Bref, le supercalculateur à la carte devient presque plug-and-play.

L’avantage est économique avant tout, grâce au choix fréquent du logiciel libre (quasi gratuit) et de PC bon marché à base de processeurs Intel Pentium III à 500 MHz. « On obtient la même puissance de calcul pour au moins 10 fois moins cher » qu’avec un supercalculateur, revendique Benjamin Levy. Et d’expliquer que la compagnie pétrolière américaine Amerada Hess louait pour 13 millions de francs sur trois ans un supercalculateur chargé d’analyser des clichés photographiques au sol pour repérer d’éventuels gisements. En basculant vers un parc de 32 ordinateurs en grappe sous Linux, le coût aurait chuté à seulement 1 million de francs. Reste qu’une partie importante de la facture est liée à la main-d’oeuvre et à l’administration en réseau. Chez Alinka, le logiciel Raisin qui coordonne les calculs de 128 machines coûte quand même 195 000 francs HT…

Le succès des ordinateurs en grappe contraint les constructeurs à jouer sur plusieurs tableaux à la fois. D’un côté, IBM fournit 256 serveurs bi-processeurs à l’université du Nouveau-Mexique pour créer un système baptisé « Los Lobos » et capable d’effectuer 375 milliards d’opérations par seconde. De l’autre, il travaille sur un modèle de super-ordinateur Blue Gene (voir édition du 6 décembre 1999) qui doit renvoyer tous les systèmes existants au rang de boulier informatique. Big Blue risque-t-il de voir ses propres machines se cannibaliser ? Pas vraiment, si l’on en croit Eric Taillard, responsable des ventes Unix chez IBM : « L’administration des parcs en cluster est difficile et revient cher. Elle est surtout moins fiable, car le risque de panne augmente lorsqu’on passe d’un seul gros système à 256 PC ». Autrement dit, la solution en réseau est surtout intéressante pour les universités, qui peuvent tolérer un redémarrage de temps en temps et disposent d’un vivier d’étudiants compétents. Pour les entreprises gourmandes en calcul scientifique ou dédié à la gestion, on préfère limiter les risques de panne en se tournant vers une seule machine, plus simple à gérer. Cela expliquerait le choix de Météo France, dont le supercalculateur Fujitsu aide à la prévision du climat, matin et soir (voir édition du 18 novembre 1999).

Toutefois, la situation pourrait évoluer rapidement. Quelques années ont suffit pour que les réseaux permettent de démocratiser le calcul en grappe. La multiplication des liaisons Ethernet à 100 Mbits/s a rendu les échanges de données entre PC suffisamment rapides pour partager les calculs. Et de l’aveu même de Dave Turek, vice-président de la division Deep Computing d’IBM, les clusters sous Linux du constructeur toucheront bientôt les entreprises…

Pour en savoir plus :

* Alinka

* Le Top 500

* IBM