au sommaire
Soutenue par les progrès en intelligence artificielle (IA) accomplis ces dernières années, la reconnaissance vocale est considérée par de nombreux spécialistes comme l'interface qui s'imposera pour interagir avec les terminaux mobilesmobiles, les systèmes domotiques et les objets connectés qui nous environnent. En effet, nous en sommes aujourd'hui à un niveau de performance où certains systèmes de reconnaissance vocale rivalisent avec les humains.
Actuellement, les assistants virtuels que l'on trouve dans nos smartphones et les enceintes « intelligentes » telles que l'Echo d'AmazonAmazon ou GoogleGoogle Home reposent sur des logiciels de reconnaissance vocale travaillant à partir d'IA hébergées sur des serveurs. Activés en permanence pour réagir à la voix, ces systèmes consomment une quantité d'énergieénergie qui ne permet pas de les intégrer dans de petits appareils électroniques et objets connectés.
Par exemple, un iPhoneiPhone utilisant l'assistant vocalassistant vocal Siri a besoin d'environ 1 wattwatt. C'est ce que nous explique une équipe de chercheurs du Massachusetts Institute of Technology (MIT) qui a mis au point une puce électronique basse puissance pour faire de la reconnaissance vocale automatique. Cette dernière n'a besoin que de 0,2 à 10 milliwatts pour fonctionner : cela se traduit par une économie d'énergie pouvant atteindre 99 %. De quoi envisager d'équiper des appareils électroniques simples pouvant être pilotés à la voix : petit électroménager, capteurscapteurs divers, vêtements connectés...
La reconnaissance vocale sur smartphone nécessite une quantité d’énergie qui ne permet pas de transposer ce type d’interface sur des appareils électroniques miniatures. © Zapp2photo, Fotolia
La puce analyse le bruit ambiant pour détecter les voix
Pour économiser de l'énergie, la puce du MIT s'appuie tout d'abord sur un circuit qui analyse le bruit ambiant et détermine s'il s'agit ou non d'une voix. Si tel est le cas, il active alors le circuit de reconnaissance vocale qui est plus énergivore. Le système fait également appel à la compressioncompression de données et à un découpage du signal vocal en sections courtes de 10 millisecondes afin de ne pas saturer la mémoire embarquée. Ainsi, la puce n'est pas sollicitée de façon trop intensive et reste sur une consommation d'énergie basse.
« La reconnaissance vocale deviendra l'interface naturelle de beaucoup d'applicationsapplications et terminaux intelligents portables », estime Anantha Chandrakasan, le professeur qui a dirigé ce programme. Les conclusions de ces travaux ont été présentées il y a quelques jours à l'International Solid-State Circuits Conference qui s'est tenue à San Francisco (États-Unis). Les chercheurs du MIT ont fabriqué leur prototype de puce avec le géant des semi-conducteurssemi-conducteurs Taiwan Semiconductor Manufacturing Company (TSMC) mais ils n'ont pas précisé la suite qu'ils comptent donner à ce projet.