Les Américains et les Australiens profitent de nouvelles fonctions dans Alexa avec la possibilité d'ajouter des tons enjoués ou tristes dans les réponses données par l'assistant vocal. Amazon propose aussi des styles de voix en fonction du sujet comme la diction journalistique pour la lecture des informations.
au sommaire
Les développeurs de chez AmazonAmazon viennent de dévoiler sur leur blog des détails concernant de nouvelles fonctions de leur assistant vocalassistant vocal AlexaAlexa. Désormais, cette intelligence artificielle sera capable d'exprimer différentes émotions, ainsi que d'adopter différents stylesstyles pour parler.
Pour parler, Alexa utilise la technologie de synthèse vocale neuronale d'Amazon, ou Neural text-to-speech (NTTS). La première nouveauté, baptisée tout simplement Alexa Emotions, permet d'y ajouter un ton enthousiaste ou triste, les deux émotions ayant trois degrés d'intensité chacune. L'assistant personnelassistant personnel peut ainsi se montrer enjoué lorsque l'utilisateur répond correctement à une question dans un jeu, ou triste en annonçant que son équipe sportive préférée a perdu. Les premiers tests ont montré que le taux de satisfaction a augmenté de 30 % avec l'utilisation des émotions.
Voici ce que cela donne lorsque Alexa est moyennement heureuse. © Amazon
De nouveaux styles de parole pour les informations et la musique
De la même manière, les développeurs ont créé de nouveaux styles de voix. Les utilisateurs aux États-Unis pourront activer des styles plus naturels pour la lecture des nouvelles à l'instar d'un journaliste ou pour la présentation de la musique, tandis que les utilisateurs australiens pourront profiter pour l'instant du style journalistique avec l'accent local. Pour cela, ils modifient l'intonation, l'emphase et les pauses dans la phrase. Le style pour les nouvelles était jugé plus naturel de 31 % et le style musical de 84 %.
Les développeurs d'applicationsapplications vocales Alexa pourront intégrer les émotions et les styles grâce à l'utilisation de simples balises SSML autour du texte, un langage de balisage pour la synthèse vocale basé sur le XML. Pour l'instant, ces nouveautés ne sont disponibles qu'aux États-Unis et en Australie. Amazon n'a pas annoncé de date de disponibilité pour d'autres régions, mais nul doute que cela arrivera prochainement avec peut-être la diction de Laurent Delahousse ou Claire Chazal pour la lecture des infos du jour.