La bioinformatique, un domaine réservé d’Apple

Cloud

Si l’année dernière, à Bio-ITWorld, le Xserve G4 restait réservé aux calculs sous BLAST ou aux activités similaires, Apple est désormais considérée avec l’arrivée du G5 comme le leader en bioinformatique.

Thomas Marr, bioinformaticien à l’Université d’Alaska Fairbanks, n’est pas un spécialiste des ordinateurs parallèles mais pour ses travaux, les clusters se sont avérés la solution la plus adaptée. « Mon groupe est impliqué dans les domaines de l’expression de données des gènes et des protéines, les analyses phylogénétiques, la simulation et la visualisation de gènes alignés et de protéines, et notamment les structures en trois dimensions. Nous utilisons pour cela un cluster de seize noeuds, équipé de PowerMac G5. Nous l’avons choisi car il disposait à l’époque, à l’automne dernier, du meilleur rapport prix/performances sur le marché. » Il faut dire que le Xserve G5 n’était alors pas encore disponible ! Mais Thomas Marr n’en a cure : l’important pour lui, ce sont les coeurs Altivec, la bande passante, la mémoire et la facilité d’utilisation des machines d’Apple. « Le PowerMac G5 a gardé son excellente position même aujourd’hui. Il nécessite moins de puissance électrique et le dégagement thermique est inférieur à la plupart des technologies de clusters. »

Historiquement, l’utilisation des Mac en sciences de la vie date de quelques années. Mais depuis qu’Apple et Genentech ont optimisé le programme BLAST de décodage du génome pour qu’il utilise les coprocesseurs vectoriels Altivec implantés dans les puces de la Pomme, l’engouement des bioinformaticiens pour ces machines a décuplé (voir édition du 21 novembre 2002). Oracle l’a bien compris : l’éditeur doit fournir sa base de données 10g pour Mac OS X, spécialement conçue pour fonctionner avec BLAST (voir édition du 15 décembre 2003). La firme de conseil BioTeam expliquait déjà l’année dernière, à l’occasion du salon Bio-ITWorld, la raison de cet engouement : « Si un client utilise énormément BLAST ou des recherches similaires, il faut lui recommander plus volontiers le Xserve car ses performances sont jusqu’à cinq fois plus élevées que celles d’autres machines. » Il faut dire que BioTeam a développé un produit destiné à la mise en clusters de Xserve ou d’autres Mac à partir d’un simple iPod ! iNquiry fonctionne aussi sur d’autres machines mais sur Mac, inutile de savoir monter une grappe de calcul : toute l’installation et la configuration tiennent dans le baladeur de la firme (voir édition du 31 mars 2003) ! « Nous avons sauté sur les fonctionnalités de clusters en utilisant le produit iNquiry », explique Thomas Marr, décidément particulièrement heureux de son choix de Mac OS X. « Les serveurs d’Apple sont basés sur l’Unix de Berkeley mais sont puissants et facilement gérables. Ils utilisent les standards de l’industrie pour les services Web, l’interface MPI [qui permet d’obtenir des hautes performances sur clusters, Ndlr], ou la connectivité en grille de calculs. »Une solution Apple dédiée à la bioinformatique

Et justement, l’Université d’Alaska entend bien profiter de ces facilités : « Nous avons l’intention d’utiliser notre cluster pour des calculs complexes qui ne peuvent pas être réalisés sur des stations de travail. Mais nous allons aussi donner aux autres scientifiques l’accès aux différents campus par le biais d’un portail Web. En fait, notre outil va faire partie du superordinateur de la Région Arctique, une grille de calcul qui rassemble les ressources de clusters sous Linux et de superordinateurs de la région », souligne Thomas Marr. « Au final, le but scientifique est de fournir aux utilisateurs des capacités analytiques de très haute performance en leur cachant la complexité du système. Cette grille devrait nous permettre d’utiliser des algorithmes plus rigoureux et demandant plus d’intensité de calculs pour extraire les données. » Et Apple ne reste pas inactive pour que ses machines soient également adoptées par les chercheurs : la firme propose depuis quelques semaines une solution bioinformatique qui comprend un cluster de calcul et la panoplie complète des applicatifs nécessaires. La solution a reçu le premier prix de la catégorie des infrastructures informatiques à la dernière Bio-ITWorld.