Le processeur Power5 d'IBM vaut le coup d'œil

Si toutes choses étaient égales et qu'IBM rendait ses systèmes aussi accessibles que Dell et Hewlett-Packard le font, le processeur IBM Power5 pourrait enterrer l'Itanium 2 d'Intel. une entreprise qui excelle non seulement dans la conception de processeurs, mais également dans la science submicronique de la fabrication et de l'emballage des puces.

Le Power5 est bien sûr très rapide. Mais cela peut également être considéré comme la première tentative sérieuse d'IBM de répondre aux besoins des clients au-delà de la vitesse. Le Power5 offre une efficacité énergétique améliorée et une évolutivité exceptionnelle, prend en charge les systèmes d'exploitation non IBM (y compris Linux et Windows), et offre un partitionnement et une virtualisation inégalés par la technologie Intel actuelle.

Le Power5 préfigure également une nouvelle génération de postes de travail et de serveurs 64 bits basés sur PowerPC du partenaire de longue date d'IBM dans Power, Apple Computer. Et IBM a récemment pris une décision inattendue pour une entreprise fondée sur des brevets en publiant l'architecture et les outils Power sous une licence ouverte.

L'influence de Power5 va au-delà de la base principale d'IBM de clients bien nantis de tant de façons. Bien qu'IBM vende également des serveurs Itanium 2, Opteron et Xeon, la société semble clairement déterminée à mettre les systèmes Power5 entre les mains des administrateurs Linux et Windows. Cela dépendra des clients, mais le muscle technique de Power5 et la fortune chancelante de l'architecture Itanium exigent que le processeur phare d'IBM fasse un voyage sous notre microscope.

Secrets de puissance

IBM a toujours attiré les esprits les plus brillants, le genre d'ingénieurs qui méritent le surnom d '«informaticien». Dans les années 1980, ces scientifiques ont conçu une architecture de processeur conçue pour la performance: l'IBM 801, le processeur RISC original. L'héritage du 801 perdure dans la série IBM Power de processeurs de classe entreprise.

La principale différence entre un processeur RISC et un processeur CISC, comme le x86 d'Intel, peut être considérée comme un bras de fer entre les programmeurs et les concepteurs de puces. Les processeurs CISC sont conçus pour faciliter la vie des développeurs d'applications en réduisant les opérations courantes à des instructions natives uniques à exécution longue, ce qui donne au CISC la réputation d'être une conception lente mais conviviale. Comparé sous cet angle, RISC est rapide et hostile. Chacune de ses instructions simples sert un objectif très étroit, s'exécute rapidement et se parallélise exceptionnellement bien. RISC nécessite des programmeurs patients, doués et des compilateurs méticuleusement optimisés; Le succès du RISC témoigne de l'abondance des deux.

L'attribut Power5 le plus connu est son intégration de deux cœurs RISC discrets sur une seule puce. Les annonces d'AMD, d'Intel et de Sun Microsystems concernant les futurs processeurs multicœurs ont attiré l'attention sur cet aspect de Power5, mais le multicœur était également une caractéristique de ses prédécesseurs, Power4 et Power4 +. Selon IBM, Power5 est entièrement compatible avec les exécutables Power4. La merveille du multicœur est qu'il offre le rêve de plus de vitesse dans moins d'espace sans augmentation marquée de la chaleur. Mais comme vous le verrez, le multicœur n'est pas simplement du SMP sur une puce.

D'une part, les cœurs du Power5 partagent un cache de niveau 2 très rapide. La vitesse et la quantité de cache sont un facteur dans les performances de tous les microprocesseurs. (L'évolution du x86 montre qu'Intel est totalement obsédé par le cache.) Avec des instructions simples volant si rapidement dans un processeur RISC, l'efficacité du cache à réduire le nombre de voyages vers la RAM devient la clé de toute la conception.

Le cache de niveau 2 du Power5 totalise un peu moins de 2 Mo. Avec un cache partagé, les données récupérées par un cœur sont immédiatement disponibles pour l'autre, ce qui augmente la probabilité que la récupération de l'instruction de programme ou du bloc de données suivant ne nécessite pas un déplacement vers la RAM qui détruit les performances. Mais le cache partagé augmente également la probabilité que les cœurs essaient d'accéder au cache en même temps, ce qu'ils ne peuvent pas faire.

IBM a implémenté un stopgap de contention de cache, divisant le cache de niveau 2 en trois segments. Cette conception permet un accès quasi-simultané au cache tant que les deux cœurs touchent différents segments de cache. IBM propose une autre solution créative au problème de contention de cache de niveau 2: un cache de niveau 3 externe de 36 Mo. Chaque cœur possède son cache de niveau 3 exclusivement, il n'y a donc aucune possibilité de conflit entre les cœurs. Bien que le cache de niveau 3 ne soit pas aussi rapide que le niveau 2, le niveau 3 est beaucoup plus rapide que la mémoire principale, et la conception de Power5 fait de la connexion entre son cœur et son cache de niveau 3 associé un lien direct. Nous considérons le remaniement par IBM de la conception du cache de niveau 3 comme l'une des principales victoires de conception dans Power5.

Un autre gain substantiel de Power5 est ses contrôleurs de mémoire sur puce. Chaque cœur Power5 possède son propre contrôleur et est capable de gérer un bloc dédié de mémoire principale. Cela a un impact énorme sur les performances globales, comme nous l'avons vu en comparant le débit mémoire d'Opteron et de Xeon, par exemple. Et dans le cas de Power5, la conception correspond à la stratégie d'IBM de parallélisation à plusieurs niveaux.

Deux ne suffit pas

Power5 n'est pas seulement dual-core; il implémente la fonction SMT (Simultaneous Multi-Threading) de Power4, qui donne à chaque cœur la capacité d'exécuter des instructions à partir de deux threads simultanément, sous certaines conditions. SMT est similaire à la technologie HTT (Hyper-Threading Technology) d'Intel, mais avec des avantages distincts qui élargissent «certaines conditions» et qui optimisent dynamiquement la parallélisation en analysant et en hiérarchisant les threads pour rendre l'exécution parallèle plus efficace - beaucoup plus efficace, nous pensons. Bien qu'il soit difficile de les isoler lors des tests, la mise en œuvre de Power5 devrait dépasser la hausse maximale de 30% qu'Intel projette pour HTT.

Power5 ajoute deux schémas de hiérarchisation des threads de base, mais indispensables. L'équilibrage dynamique des ressources tente de maintenir la fluidité des flux d'instructions en analysant le comportement des threads et en mettant à l'écart le code qui pourrait ralentir un flux SMT. Par exemple, les instructions qui doivent être exécutées en séquence pour obtenir un résultat précis peuvent verrouiller ce thread dans le processeur pendant un certain temps. Power5 essaie de prédire cela et d'exécuter des instructions plus simples jusqu'à ce qu'il y ait de la place pour exécuter la séquence sans obstruer SMT.

Dans un autre gain de conception impressionnant, la priorité de thread réglable de Power5 donne aux systèmes d'exploitation, aux pilotes et aux applications la possibilité d'attribuer un niveau de priorité arbitraire à chaque thread. Cette priorité de thread définie par l'application est prise en compte dans les calculs d'équilibrage dynamique des ressources et est utilisée plus largement pour déterminer la durée pendant laquelle un thread reste actif dans le processeur. Il offre également aux systèmes d'exploitation un moyen simple de contrôler la conservation de l'énergie.

Si vous avez beaucoup de threads à haute priorité en cours d'exécution, la boîte fonctionnera à chaud. Mais à mesure que le système d'exploitation abaisse les priorités des threads, le processeur exécutera plus de cycles d'inactivité et donc plus froid. Si vous abaissez toutes les priorités de thread à leur niveau le plus bas, le processeur passe en mode basse consommation. C'est l'approche la plus simple de la gestion de l'alimentation que nous puissions imaginer.

Enfin, Power5 utilise ce qu'il sait sur les installations nécessaires à chaque instruction RISC pour, essentiellement, mettre hors tension les parties de la puce qui ne sont pas nécessaires à ce moment-là. Cela donne potentiellement une nouvelle tournure aux fameux problèmes de puissance et de chaleur de Power. Cela semble certainement plus simple que les schémas de gestion de l'alimentation basés sur le système d'exploitation tels que ceux utilisés par les processeurs x86.

Vous pourriez ne jamais remarquer

Rien que sur la technologie, Power5 est en mesure de dominer. Mais aussi incroyable que cela puisse paraître aux nombreux sceptiques d'Itanium 2 qui partagent leurs opinions avec, la majorité des observateurs ont déjà appelé le concours Itanium 2 / Power5 en faveur d'Intel.

C'est une évaluation étrange car, dans ce cas, IBM tire un Intel sur Intel. RISC possède le marché Unix, Unix possède le marché du milieu de gamme au haut de gamme, et Intel ne fait pas de RISC. C'est dans le froid sur ces bons de commande de plusieurs millions de dollars. Intel est effectivement verrouillé à moins qu'il ne puisse convaincre les acheteurs qu'Itanium 2 rend obsolète RISC. Intel pourra-t-il entrer par effraction? Nous pensons qu'il faudra des années à l'Itanium pour mettre le RISC de côté, et pendant son introduction, Power et Sparc continueront d'évoluer.

Ce qui rend cela difficile à appeler, c'est qu'IBM veut le marché d'Intel autant qu'Intel veut celui d'IBM. IBM vend des serveurs Power5 pour 5 000 $ avec Linux préinstallé. Revenez en arrière et parcourez les spécifications pour comprendre pourquoi un serveur Power5 à 5000 $ pourrait être intéressant.

Les analystes gravant des pierres tombales pour Power notent que l'activité de puces d'IBM ne rapporte pas d'argent. Mais son activité de systèmes l'est, et maintenant ces deux unités ne font plus qu'un. C'est une décision intelligente: créez des puces pour les systèmes que vous vendez; construisez des systèmes autour des puces que vous fabriquez. Il est également judicieux de diffuser la conception et les outils au public. Chaque titulaire de licence ouvert est un client de fabrication potentiel, et la propriété intellectuelle non grevée va provenir de génies qui ne font pas partie de la masse salariale d'IBM.

Ce sont de bonnes stratégies pour se rapprocher du marché d'entrée. Si seulement IBM n'avait pas à traiter avec les clients. Big Blue n'a jamais été en mesure d'apporter au bas de gamme de son catalogue le poli de la marque et la confiance des clients que Dell et HP apprécient à la pelle. L'excellent travail accompli par les ingénieurs d'IBM est lié au mauvais marketing de l'entreprise. Selon toute vraisemblance, si vous n'utilisez pas d'équipement IBM maintenant, vous ne regarderez jamais un serveur Power5 quel que soit le prix.

IBM a intentionnellement lié le succès de Power5 à Linux au niveau d'entrée. Mais il est difficile d'extraire de la valeur ajoutée d'un logiciel que le public pense pouvoir télécharger gratuitement, et Linux est un système d'exploitation que les acheteurs n'ont pas tendance à acheter de nouveau matériel pour l'exécuter. En d'autres termes, Linux ne vendra pas de serveurs d'entrée Power5. À 5 000 $ à 6 000 $, le serveur Power5 le moins cher d'IBM n'est pas assez bon marché comparé à un serveur Opteron ou Xeon EM64T (Extended Memory 64 Technology) très bon marché exécutant Linux.

D'un autre côté, le gros fer Unix se vend et les clients achèteront toujours plus de ce qu'ils utilisent déjà. Ils achèteront ce que leurs consultants en solutions leur conseillent. IBM dépasse tous les autres dans sa capacité à maîtriser les grands comptes. Vous ne pouvez pas détacher un client du matériel IBM au milieu de gamme et plus. Le message global sur Power5 sera donc déformé pour la presse et le grand public, mais les poursuites sur le terrain contournent le marketing d'IBM. Dans les relations IBM-client, vous ne pouvez pas battre IBM.

Power5 a à peu près tout: vitesse, simplicité, innovation, rétrocompatibilité transparente, un ensemble d'outils de développement mature et le soutien d'un géant technologique. C'est une réalisation technique sans égal, créée par les ingénieurs les plus intelligents du monde. Si le marketing d'IBM correspond à l'intelligence de son ingénierie, faites attention, Intel.