ElevenLabs profite de l’engouement autour des vidéos générées par Sora d’OpenAI pour annoncer sa propre intelligence artificielle capable de générer des effets sonores. Combinées, ces deux IA peuvent créer des clips très réalistes.
au sommaire
La semaine dernière, OpenAI a débuté ce qui pourrait être le début d'une nouvelle ère cinématographique en dévoilant Sora, une intelligence artificielle capable de générer des vidéos d'une minute à partir d'une simple requête écrite. Toutefois, ces dernières sont incomplètes, car entièrement silencieuses.
ElevenLabs vient d'annoncer sur son blog travailler actuellement sur une solution sous la forme d’une IA qui génère des clips audio. La firme est connue pour son logiciel de synthèse vocalesynthèse vocale, et un outil qui traduit des paroles dans une autre langue en conservant la voix. Elle a utilisé sa nouvelle IA, baptisée tout simplement Sound Effects, afin de générer des effets sonores pour accompagner les vidéos générées par Sora.
Une sélection de clips générés par Sora d’OpenAI, avec des effets sonores générés par ElevenLabs Sound Effects. © ElevenLabs
Générer des effets sonores à partir de texte
La firme a demandé à l'IA de générer des sons en utilisant des prompts tels que « vaguesvagues qui s'écrasent », « métalmétal qui s'entrechoque », « gazouillis d'oiseaux » et « moteur de voiturevoiture de course ». À l'heure actuelle, la génération ne prend en compte que les requêtes écrites, et ne peut pas analyser la vidéo pour générer une piste audio automatiquement. À la vitessevitesse à laquelle les intelligences artificielles évoluent, cette fonctionnalité arrivera sans doute rapidement, qu'elle soit développée par ElevenLabs ou un tiers.
L’IA est encore en développement et n'est donc pas encore accessible au public. ElevenLabs n'a pas indiqué de date de lancement, mais il est possible de s'inscrire sur liste d'attente pour être parmi les premiers à y avoir accès.