Archowum tagów: housse personnalisé

Etui sony xperia m5 What Comes After Cyclone-coque iphone 6 personnalisée-ohxfsj

CPU A8: Que se passe-t-il après le cyclone

Malgré l’importance de la CPU dans les conceptions Apple SoC, il continue à surprendre à quel point nous savons relativement peu de leurs architectures, même des années après le fait. Même si le processeur était si important qu’Apple a vu le besoin de créer son propre design personnalisé, et a ensuite fait deux architectures en seulement deux ans, ils n’aiment pas parler de ce qu’ils ont fait avec leurs architectures. Ceci est malheureusement particulièrement le cas au début d’un cycle de vie SoC, et pour A8, il ne sera pas différent.

Dans l’ensemble, d’après ce que nous pouvons dire, le processeur de l’A8 n’est pas un écart important par rapport à la CPU dans A7, mais ce n’est pas une mauvaise chose. Avec le Cyclone Apple, la conception est très solide: utilisez un design IPC large et élevé avec une grande latence afin d’atteindre des niveaux de performance élevés à des vitesses d’horloge faibles. En gardant le processeur large et la vitesse d’horloge faible, Apple a pu atteindre ses objectifs de performance sans avoir à repousser les limites de la consommation électrique, car des vitesses d’horloge plus basses permettent de contrôler l’utilisation du processeur. Tout cela ressemble beaucoup à Intel Core, tout compte fait. De plus, compte tenu du fait que Cyclone était un modèle futuriste avec des capacités ARMv8 AArch64 et des performances déjà solides, Apple ne subit pas la même pression pour refondre son architecture CPU comme le font les autres concepteurs de processeurs ARMv7 actuels.

Par conséquent, à partir des informations que nous avons pu extraire et des tests que nous avons effectués, le processeur A8 n’est pas radicalement différent de Cyclone. Pour être sûr qu’il y a quelques différences qui indiquent clairement que ce n’est pas juste un cyclone fonctionnant à des vitesses d’horloge légèrement plus élevées, mais nous n’avons pas vu le même genre de révision générale qui définissait Swift et Cyclone.

Malheureusement, Apple a plus que jamais renforcé les fuites d’informations et les publications involontaires avec A8, de sorte que la quantité d’informations provenant d’Apple sur ce nouveau noyau est très limitée. En fait, cette fois, nous ne connaissons même pas le nom de la CPU. Pour le moment, nous l’appelons ‘Enhanced Cyclone’ il est descriptif de l’architecture mais nous sommes assez certains qu’il a un nom officiel au sein d’Apple pour le distinguer de Cyclone, un nom que nous espérons découvrir plus tôt que plus tard.

En tout cas, l’une des choses que nous savons sur Enhanced Cyclone est que contrairement à Apple GPU de choix pour A8, Apple a vu une réduction significative de la taille de la CPU de l’A7 28nm à l’A8 20nm. Selon les estimations de Chipworks, la taille du die Cyclone est de coque iphone france 17.1mm2 contre 12.2mm2 pour Enhanced Cyclone. Sur une base relative, cela signifie que Cyclone amélioré est 71% de la taille de Cyclone, ce qui signifie que Cyclone amélioré est un processeur relativement plus grand composé de plus de transistors que Cyclone. Il n’est pas beaucoup plus grand, mais il est plus gros à tel point qu’il est clair qu’Apple a encore amélioré son efficacité par rapport à Cyclone.

La question du moment est ce que Apple a mis leurs transistors supplémentaires et l’espace de travail pour travailler. Une partie de cela est sans aucun doute l’interface de mémoire, qui, comme nous l’avons vu précédemment, les temps d’accès au cache L3 sont près de 20ns plus rapides dans nos cas-tests. Mais si nous creusons plus profondément, les choses commencent à devenir très intéressantes.

Tout d’abord, dans la plupart de nos tests, Enhanced Cyclone se comporte de manière très similaire à Cyclone. Compte tenu du fait que A8 est cadencé à 1,4 GHz contre 1,3 GHz pour A7, dans de nombreux cas-tests de bas niveau, les deux fonctionnent comme s’ils étaient le même processeur. Sur la base de ces données, il semble que les principes Vente Coque Huawei de base de Cyclone n’ont pas été modifiés pour Enhanced Cyclone. Cyclone amélioré est toujours une architecture très large de six micro-op, et les pénalités de mauvaise prédiction de branche sont similaires de sorte que nous examinons probablement la même longueur de pipeline.

Cependant, à partir de nos tests de bas niveau, deux caractéristiques spécifiques se détachent: la multiplication entière et l’addition à virgule flottante. Quand il s’agit de la multiplication entière, Cyclone avait une seule unité de multiplication et il a fallu quatre cycles pour l’exécuter. Cependant, dans le cas d’un cyclone amélioré, ces opérations sont en train de mesurer trois cycles à exécuter. Mais plus surprenant est le débit total de multiplication d’entier; La performance de la multiplication entière a maintenant plus que doublé. Bien que cela ne nous donne pas assez de données pour dessiner complètement les chemins d’entiers Enhanced Cyclone, toutes les données pointent vers Enhanced Cyclone doublement sur ses unités de multiplication entières, ce qui signifie que la dernière architecture d’Apple en a maintenant deux.

Pendant ce temps, l’addition à virgule flottante montre des avantages similaires, mais pas aussi grands que la multiplication entière. Le débit est tel qu’il semble toujours y avoir trois FP ALU, mais comme la multiplication d’entier, la latence d’instruction a été réduite. Apple a réussi à rogner un cycle sur l’ajout de FP, de sorte qu’il se termine maintenant en quatre cycles au lieu de cinq. Ces deux améliorations indiquent que Enhanced Cyclone n’est pas identique à Cyclone, l’unité INT MUL supplémentaire les rendant particulièrement similaires mais avec des architectures CPU encore subtilement différentes.

En dehors de ces opérations de bas niveau, la plupart des autres aspects de Enhanced Cyclone semblent inchangés. Le cache L1 reste à 64Ko I $ + 64Ko D $ par core CPU, où il a été récemment doublé pour Cyclone. Pour le cache L2, Chipworks pense qu’il peut y avoir des caches L2 séparés pour chaque cœur de CPU, et alors que la bande passante L2 cache un peu mieux sur Cyclone amélioré que sur Cyclone, ce n’est pas un pistolet qui prouverait la présence de caches L2 séparés. Et bien sûr, le cache L3 est à 4Mo, avec les améliorations de latence mentionnées plus haut.

Pour reprendre une analogie avec Intel, la disposition et les performances d’Enhanced Cyclone par rapport à Cyclone sont assez similaires à celles d’Intel, où de plus petites améliorations de caractéristiques ont lieu à côté d’un rétrécissement. Dans ce cas, Apple a leur die shrink à 20nm; Pendant ce temps, ils ont fait quelques petites modifications à l’architecture pour améliorer les performances à travers plusieurs scénarios. Dans le même temps Apple a fait une bosse modérée dans la vitesse d’horloge de 1,3 GHz à 1,4 GHz, mais rien d’extrême. En fin de compte alors que deux architectures CPU ne constituent pas un modèle, si Apple devait implémenter tick tock alors c’est à peu près à quoi cela ressemblerait.

En continuant, après avoir terminé nos tests de bas niveau, nous voulions également passer du temps à comparer Enhanced Cyclone avec son prédécesseur à des tests de haut niveau. Les tests de bas niveau peuvent nous dire si les opérations individuelles ont été améliorées tandis que les tests de haut niveau peuvent nous dire quelque chose sur ce que l’impact des performances sera dans des charges de travail réalistes.

Pour notre premier benchmark de haut niveau, nous passons à SPECint2000. Développé par la Standard Performance Evaluation Corporation, SPECint2000 est le composant entier de leur plus grand banc d’essai SPEC CPU2000. Conçu au tournant du siècle, officiellement SPEC CPU2000 a été retiré pour les processeurs PC, mais avec les processeurs mobiles environ une décennie derrière leurs homologues PC en performance, SPEC CPU2000 est actuellement un très bon ajustement pour les capacités de Cyclone et Enhanced Cyclone.

SPECint2000 est composé de 12 benchmarks qui sont ensuite utilisés pour calculer un score de pic final. Bien que dans notre cas, nous sommes plus intéressés par les résultats individuels.

En gardant à l’esprit que A8 est cadencé à 100MHz (7,7%) plus haut que A7, tous les benchmarks SPECint2000 montrent des gains de performance au-delà de l’augmentation de la vitesse d’horloge, indiquant que chaque benchmark a bénéficié d’une certaine manière. Parmi ceux-ci, MCF, GCC, PerlBmk et GAP, en particulier, affichent les gains les plus importants, entre 20% et 55%. Grosso modo, tout ce qui est potentiellement lourd de branche voit certains des plus petits gains tandis que tout ce qui joue dans les changements de multiplication bénéficie plus.

MCF, un benchmark d’optimisation combinatoire, finit par être de loin la plus aberrante. Étant donné que ce sont tous des repères entiers, il se peut fort bien que MCF bénéficie le plus des améliorations de la multiplication entière, car ses performances sont très proches du suivi de l’augmentation de 2X du débit de multiplication. Cela est également de bon augure pour tout autre type de travail qui est également limité par les performances de multiplication d’entiers, bien que ces charges de travail ne soient pas particulièrement courantes dans le monde réel de l’utilisation de smartphones.

Contrairement à SPECint2000, Geekbench 3 est un mélange de charges de travail en nombres entiers et en virgule flottante, ce qui nous donnera un second regard sur les résultats entiers et des améliorations à virgule flottante.

Alors que les tests à virgule flottante de bas niveau que nous avons exécutés plus tôt ne montraient pas de changement aussi significatif de la performance de l’architecture en virgule flottante, nos tests de haut niveau montrent que les tests en virgule flottante se portent plutôt bien. Ce qui montre que tout ne peut pas être capturé dans les tests de bas niveau, en particulier les aspects moins tangibles tels que les fenêtres d’instructions. Plus important encore, cela montre que les gains de performances de Cyclone amélioré ne sont que limités aux charges de travail en nombres entiers, mais couvrent également les virgules flottantes.

Dans l’ensemble, même sans modification radicale de l’architecture, grâce à une combinaison d’augmentations de la vitesse d’horloge, d’optimisations architecturales et d’améliorations de la mémoire, Enhanced Cyclone présent sur le SoC A8 ressemble à une solide performance de Cyclone et A7. Au cours de l’année prochaine, Apple va faire face à la première véritable concurrence dans l’espace ARMv8 64 bits de Cortex A57 et d’autres conceptions haute performance, et bien qu’il soit trop tôt pour deviner comment ceux-ci vont comparer, à tout le moins va aller avec une main forte. Plus excitante, la plupart de ces améliorations de performance s’appuient sur IPC à un seul thread déjà fort d’Apple, ce qui signifie que dans ces charges de travail tenaces qui ne Coque Huawei Soldes bénéficient pas de la mise à l’échelle multi-cœur, Apple semble très bien..

Permalink do tego artykułu: http://podwodna-bydgoszcz.pl/?p=2479