En permettant à l’apprentissage profond de fonctionner à la vitesse de la lumière, cette puce pourrait permettre aux appareils de pointe d’effectuer une analyse de données en temps réel avec des capacités améliorées.
Alors que de plus en plus d’appareils connectés nécessitent une bande passante plus importante pour des activités telles que le télétravail et le cloud computing, la gestion du spectre sans fil limité partagé par tous les utilisateurs devient de plus en plus difficile.
Pour résoudre ce problème, les ingénieurs se tournent vers l’intelligence artificielle pour gérer le spectre sans fil de manière dynamique, dans le but de réduire la latence et d’améliorer les performances. Cependant, la plupart des techniques d’IA permettant de traiter et de classer les signaux sans fil consomment beaucoup d’énergie et ne peuvent pas fonctionner en temps réel.
Aujourd’hui, des chercheurs du MIT ont créé un nouvel accélérateur matériel d’IA spécialement conçu pour le traitement du signal sans fil. Ce processeur optique effectue des tâches d’apprentissage automatique à la vitesse de la lumière, classant les signaux sans fil en nanosecondes.
La puce photonique fonctionne environ 100 fois plus rapidement que les meilleures alternatives numériques disponibles et atteint une précision d’environ 95 % dans la classification du signal. Il est également évolutif et adaptable pour diverses tâches de calcul haute performance. De plus, la puce est plus petite, plus légère, plus abordable et plus économe en énergie que le matériel d’IA numérique traditionnel.
Cette technologie pourrait être particulièrement précieuse pour les futurs systèmes sans fil 6G, tels que les radios cognitives qui améliorent les débits de données en ajustant les formats de modulation sans fil en fonction des conditions en temps réel.
En permettant aux périphériques périphériques d’effectuer des calculs d’apprentissage profond en temps réel, l’accélérateur matériel pourrait accélérer considérablement une gamme d’applications au-delà du traitement du signal. Il s’agit notamment de permettre aux véhicules autonomes de réagir instantanément aux changements environnementaux ou de permettre aux stimulateurs cardiaques intelligents de surveiller en permanence la santé cardiaque.
“Il existe de nombreuses applications qui seraient activées par des appareils périphériques capables d’analyser les signaux sans fil. Ce que nous avons présenté dans notre article pourrait ouvrir de nombreuses possibilités d’inférence d’IA fiable et en temps réel. Ce travail est le début de quelque chose qui pourrait avoir un impact considérable”, déclare Dirk Englund, professeur au département de génie électrique et d’informatique du MIT, chercheur principal au sein du groupe de photonique quantique et d’intelligence artificielle et du laboratoire de recherche en électronique (RLE), et auteur principal de l’article.
Il est rejoint sur l’article par l’auteur principal Ronald Davis III PhD ’24 ; Zaijun Chen, ancien postdoctorant du MIT qui est maintenant professeur adjoint à l’Université de Californie du Sud ; et Ryan Hamerly, scientifique invité au RLE et scientifique principal chez NTT Research. La recherche a été publiée dans Science Advances.
Le traitement à la vitesse de la lumière
Les accélérateurs d’IA numériques actuels pour le traitement du signal sans fil fonctionnent en convertissant le signal en image et en le faisant passer par un modèle d’apprentissage profond pour la classification. Bien que cette méthode soit très précise, les réseaux neuronaux profonds nécessitent une puissance de calcul importante, ce qui rend l’approche inadaptée à de nombreuses applications qui nécessitent des réponses rapides et en temps réel.
Les systèmes optiques peuvent accélérer les réseaux neuronaux profonds en codant et en traitant les données à l’aide de la lumière, qui est également moins gourmande en énergie que l’informatique numérique. Mais les chercheurs ont eu du mal à maximiser les performances des réseaux neuronaux optiques à usage général lorsqu’ils sont utilisés pour le traitement du signal, tout en garantissant que le dispositif optique est évolutif.
En développant une architecture de réseau neuronal optique spécifiquement destinée au traitement du signal, qu’ils appellent réseau neuronal optique à transformation de fréquence analogique multiplicative (MAFT-ONN), les chercheurs se sont attaqués de front à ce problème.
Le MAFT-ONN résout le problème de l’évolutivité en codant toutes les données du signal et en effectuant toutes les opérations d’apprentissage automatique dans ce que l’on appelle le domaine fréquentiel — avant que les signaux sans fil ne soient numérisés.
Les chercheurs ont conçu leur réseau neuronal optique pour effectuer toutes les opérations linéaires et non linéaires en ligne. Les deux types d’opérations sont nécessaires à l’apprentissage profond.
Grâce à cette conception innovante, ils n’ont besoin que d’un seul dispositif MAFT-ONN par couche pour l’ensemble du réseau neuronal optique, contrairement à d’autres méthodes qui nécessitent un dispositif pour chaque unité de calcul individuelle, ou “neurone.”
“Nous pouvons installer 10 000 neurones sur un seul appareil et calculer les multiplications nécessaires en une seule fois”, explique Davis.
Les chercheurs y parviennent en utilisant une technique appelée multiplication photoélectrique, qui augmente considérablement l’efficacité. Cela leur permet également de créer un réseau neuronal optique qui peut être facilement étendu avec des couches supplémentaires sans nécessiter de surcharge supplémentaire.
Les résultats en nanosecondes
MAFT-ONN prend un signal sans fil en entrée, traite les données du signal et transmet les informations pour les opérations ultérieures effectuées par le périphérique périphérique. Par exemple, en classant la modulation d’un signal, MAFT-ONN permettrait à un appareil de déduire automatiquement le type de signal pour extraire les données qu’il transporte.
L’un des plus grands défis auxquels les chercheurs ont été confrontés lors de la conception de MAFT-ONN était de déterminer comment mapper les calculs d’apprentissage automatique au matériel optique.
“Nous ne pouvions pas simplement retirer un cadre d’apprentissage automatique normal de l’étagère et l’utiliser. Nous avons dû le personnaliser pour l’adapter au matériel et trouver comment exploiter la physique afin qu’il effectue les calculs que nous souhaitions”, explique Davis.
Lorsqu’ils ont testé leur architecture sur la classification des signaux dans des simulations, le réseau neuronal optique a atteint une précision de 85 % en un seul coup, ce qui peut rapidement converger vers une précision de plus de 99 % en utilisant plusieurs mesures. MAFT-ONN n’a nécessité qu’environ 120 nanosecondes pour réaliser l’ensemble du processus.
“Plus vous mesurez longtemps, plus vous obtiendrez de précision. Étant donné que MAFT-ONN calcule les inférences en nanosecondes, vous ne perdez pas beaucoup de vitesse pour gagner en précision”, ajoute Davis.
Alors que les appareils de radiofréquence numériques de pointe peuvent effectuer des inférences d’apprentissage automatique en quelques microsecondes, l’optique peut le faire en quelques nanosecondes, voire quelques picosecondes.
À l’avenir, les chercheurs souhaitent utiliser ce que l’on appelle des schémas de multiplexage afin de pouvoir effectuer davantage de calculs et faire évoluer le MAFT-ONN. Ils souhaitent également étendre leur travail à des architectures d’apprentissage profond plus complexes qui pourraient exécuter des modèles de transformateurs ou des LLM.