Le module de dictée vocale du clavier Gboard d’Android fonctionne désormais sans latence et sans nécessiter de connexion de données. Pour y parvenir Google a réussi à implanter un système de réseau neuronal très compact sur les mobiles.
au sommaire
GoogleGoogle vient de mettre à jour son clavier virtuel pour mobile AndroidAndroid et notamment sa fonction de dictée vocale. La grande nouveauté, c'est que plutôt que d'exploiter ses serveurs distants pour assurer la reconnaissance vocale et sa transcriptiontranscription, le géant d'Internet implante directement cette capacité dans le téléphone. Plus besoin donc de disposer d'une connexion réseau pour réaliser l'opération. Le Gboard intègre désormais un système de réseau neuronal capable de réaliser l'opération.
Le résultat de la démonstration est bluffant, puisqu'il n'y a plus de temps de latence. Les mots s'affichent caractère par caractère en même temps que la dictée. Pour le moment, cette faculté n'est disponible que pour le clavier anglais-américain et uniquement sur les smartphones Pixel. À l'origine, pour pouvoir analyser et retranscrire la dictée vocale, le système occupait plus de 2 Go de capacité. Google est parvenu à réduire ce réseau neuronal à 450 Mo, puis à le compacter pour qu'il ne dépasse pas 80 Mo !
Google, nouvel apôtre de la confidentialité des données
Mine de rien, cet exemple marque une nouvelle philosophie de Google pour Android et les mobiles. Plutôt que d'exploiter des serveurs distants, l'arrivée de processeurs véloces embarqués dans les smartphones, même positionnés en entrée de gamme, permet désormais de traiter des opérations faisant appel à l'intelligence artificielle directement sur le mobile.
Pour Google, embarquer l'IAIA sur le smartphone règle le problème de confidentialitéconfidentialité des données, puisque celles-ci ne vont pas transiter sur ses serveurs. C'est pourquoi la firme multiplie ce genre de pratique sur ses différents outils. C'est déjà le cas avec les réponses automatiques implantées dans l'applicationapplication Gmail. Ces réponses sont directement générées par les algorithmes sur le smartphone et non pas par les serveurs.