L’Intel Core i7, champion du calcul flottant… mais pour combien de temps ?

Le benchmark Linpack permet de mesurer la capacité qu’a un processeur à traiter les nombres flottants. Bien connu, il sert de base au top500 des ordinateurs les plus rapides de la planète.

Roy Longbottom s’est appuyé sur cet outil pour évaluer les performances de certaines puces. Le Core i7 860 d’Intel tient la dragée haute à ses concurrents, avec plus de 2 gigaflops de puissance affichée en double précision. Il est vrai qu’il dispose d’un moteur dont la fréquence de fonctionnement est particulièrement élevée : 2,8 GHz (3,46 GHz en mode turbo).

Des différences impressionnantes

Premier enseignement, le haut de gamme d’Intel est près de 11 fois plus rapide qu’un Atom cadencé à 1,6 GHz. Plus étonnant, le Core i7 860 n’est que deux fois plus véloce qu’un Pentium 4 cadencé à 3,7 GHz, malgré la différence constatée entre les deux composants en termes d’architecture et de nombre de cœurs.

L’importance du système d’exploitation et du compilateur est également notable. Ainsi, les tests réalisés sous Linux en environnement 32 bits donnent de meilleurs résultats que sous Windows avec des puces AMD… et de moins bons avec des composants Intel. En environnement 64 bits – le GCC activant alors toutes ses optimisations – la tendance se renverse, les résultats au benchmark Linpack étant en moyenne 27 % supérieurs à ceux obtenus sous Windows 32 bits.

ARM et Atom au coude à coude

Chez ARM, un Cortex-A9 cadencé à 1,5 GHz sous Android décroche un score 6,3 % inférieur à celui d’un Atom à 1,6 GHz fonctionnant sous Windows. À fréquence de fonctionnement identique, la différence n’est plus que de 0,1 % en faveur de l’offre d’Intel.

L’arrivée prochaine des composants Cortex-A15 devrait aisément changer la donne, car l’unité de traitement sur les nombres flottants y a été grandement améliorée. Toutefois, c’est du côté de l’interface mémoire que tout se jouera.

La suite en page deux…

De l’importance toute relative des FPU

Au vu de l’évolution des techniques de calcul, la présence d’une unité de traitement des nombres flottants (FPU) performante est aujourd’hui largement contestée. Plusieurs machines du top500 utilisent dorénavant des GPU, bien plus efficaces dans ce domaine, le moindre composant graphique, même mobile, proposant une puissance de traitement nettement supérieure à celles des meilleurs FPU.

Les charges de travail se déplacent ainsi progressivement du FPU vers le GPU. Dans le monde desktop, les choses vont toutefois plus lentement. En effet, utiliser le GPU pour de petits calculs est couteux en temps de transferts entre le processeur central et la carte graphique.

AMD et Creative en pointe

Certaines solutions existent toutefois. Dans le monde x86, l’initiative Fusion d’AMD permet de rapprocher – au fil des évolutions – le CPU et le GPU. À terme, le GPU fera partie intégrante du processeur central et sera aussi facile à adresser qu’une unité multimédia de type SSE.

Cette évolution devrait s’achever en 2014. Le FPU sera alors uniquement utilisé pour des applications d’ancienne génération. La firme anticipe d’ailleurs cette révolution avec ses composants Bulldozer, qui intègrent deux fois plus d’unités dédiées aux nombres entiers qu’aux nombres flottants.

Du côté des ARM, la situation est plus floue quant aux plans des concepteurs de puces, même s’il est probable que NVIDIA jouera lui aussi la carte de la fusion CPU – GPU. Certains ont d’ores et déjà bien avancé dans cette direction, comme ZiiLabs (filiale de Creative), qui distribue une puce comprenant un ensemble de 96 cœurs spécialisés. À la clé, une puissance de calcul facilement exploitable de 58 gigaflops en simple précision. De quoi enterrer les plus performants des processeurs Intel.

Crédit photo : © Wong Sze Fei – Fotolia.com


Voir aussi
Quiz ITespresso.fr – Armé pour choisir le bon microprocesseur ?