Nouveau transistor
Une équipe de recherche de l'Université de Pennsylvanie, Sandia National Laboratories et Brookhaven National Laboratory a dévoilé une nouvelle architecture informatique, basée sur le principe du calcul en mémoire (CIM), qui est entièrement sans transistor - et qui pourrait s'avérer considérablement plus efficace pour les charges de travail d'intelligence artificielle (IA), y compris l'IA en périphérie.
"Même lorsqu'ils sont utilisés dans une architecture de calcul en mémoire, les transistors compromettent le temps d'accès aux données", explique le co-responsable du projet Deep Jariwala, processeur adjoint au département d'ingénierie électrique et des systèmes (ESE) de l'Université de Pennsylvanie, à propos de la décision de l'équipe de s'éloigner des blocs de construction standard actuels des ordinateurs modernes. "Ils nécessitent beaucoup de câblage dans l'ensemble des circuits d'une puce et utilisent donc plus de temps, d'espace et d'énergie que ce que nous voudrions pour les applications d'IA. La beauté de notre conception sans transistor est qu'elle est simple, petite et rapide, et qu'elle nécessite très peu d'énergie."
L'architecture de l'équipe s'appuie sur le principe établi du calcul en mémoire (CIM), dans lequel des tâches sélectionnées peuvent être effectuées directement là où les données sont conservées sans le brassage habituel requis pour les transférer vers le CPU, le GPU ou l'accélérateur, les traiter, puis les renvoyer à nouveau dans la mémoire système. Grâce à CIM, un gros goulot d'étranglement est supprimé et l'efficacité du système est considérablement améliorée, du moins pour certaines charges de travail.
Ce que l'équipe a créé va encore plus loin, non seulement en supprimant les transistors, mais également en passant à un nouveau matériau semi-conducteur appelé nitrure d'aluminium allié au scandium (AlScN), qui présente un comportement de commutation ferroélectrique - commutant physiquement beaucoup plus rapidement que les matériaux semi-conducteurs traditionnels utilisés pour les dispositifs de mémoire non volatile.
"L'un des principaux attributs de ce matériau est qu'il peut être déposé à des températures suffisamment basses pour être compatible avec les fonderies de silicium", explique Troy Olsson, co-responsable et professeur assistant à l'ESE. "La plupart des matériaux ferroélectriques nécessitent des températures beaucoup plus élevées. Les propriétés spéciales d'AlScN signifient que nos dispositifs de mémoire démontrés peuvent aller au-dessus de la couche de silicium dans une pile hétéro-intégrée verticale."
"Pensez à la différence entre un parking à plusieurs étages d'une capacité de cent voitures et une centaine de places de parking individuelles réparties sur un seul lot", poursuit Olsson. « Qu'est-ce qui est le plus efficace en termes d'espace ? Il en va de même pour les informations et les appareils dans une puce hautement miniaturisée comme la nôtre. Cette efficacité est aussi importante pour les applications qui nécessitent des contraintes de ressources, telles que les appareils mobiles ou portables, que pour les applications extrêmement énergivores, telles que les centres de données.
L'architecture sans transistor de l'équipe a le potentiel, selon l'équipe, d'être 100 fois plus rapide qu'un processeur conventionnel, tout en offrant une précision supérieure. « Disons », explique Jariwala, « que vous avez une application d'IA qui nécessite une grande mémoire pour le stockage ainsi que la capacité de faire de la reconnaissance de formes et de la recherche. Pensez aux voitures autonomes ou aux robots autonomes, qui doivent réagir rapidement et avec précision à des environnements dynamiques et imprévisibles. En utilisant des architectures conventionnelles, vous auriez besoin d'une zone différente de la puce pour chaque fonction et vous brûleriez rapidement la disponibilité et l'espace. ."
« Cette recherche est très importante », affirme le premier auteur Xiwen Liu, candidat au doctorat à l'ESE, « car elle prouve que nous pouvons compter sur la technologie de la mémoire pour développer des puces qui intègrent de multiples applications de données d'IA d'une manière qui défie vraiment les technologies informatiques conventionnelles. Nous concevons du matériel qui améliore le fonctionnement des logiciels, et avec cette nouvelle architecture, nous nous assurons que la technologie est non seulement rapide, mais aussi précise.
Les travaux de l'équipe ont été publiés dans la revue Nano Letters sous des conditions fermées, avec une préimpression en libre accès disponible sur le serveur arXiv de Cornell.