Pourquoi peut-il être bon de créer son clone vocal ? Pour bien des applications. Vous souhaitez adresser un speech à des interlocuteurs, mais n’avez pas le temps de l’enregistrer ? Soumettez le texte à votre clone vocal. Vous voulez transformer un ebook que vous avez écrit en un livre audio ? Le faire réaliser par une application peut faire gagner bien du temps.


au sommaire


    Les applicationsapplications de clonageclonage vocal sont devenues très fortes et elles savent aujourd'hui énoncer des phrases avec force nuance, placer dans la voix l'émotion appropriée, marquer des pauses, etc.

    Un service habituellement payant

    Si l'on vous parle de gérer la voix par intelligence artificielle, vous pensez probablement à Eleven Labs. Ce service s'est rapidement imposé comme l'alter ego d'applications comme Midjourney ou ChatGPT en matièrematière de traitement de la voix, qu'il s'agisse de faire intervenir un speaker prédéfini sur un texte ou bien votre propre voix. Toutefois, comme la plupart des applications d’intelligence artificielle, Eleven Labs, au-delà d'une utilisation basique, fonctionne sur le principe d'un abonnement payant mensuel. C'est notamment le cas pour la fonction de clonage vocal de Eleven Labs qui ne fonctionne seulement à partir d'un abonnement, certes fort abordable - 5 euros pour 30 minutes par mois. Bien d'autres applications sont apparues, mais la majorité d'entre elles semblent estimer que cette fonction de clonage vocal se doit d'être payante, après une période d'essai habituellement courte.

    De fait, si votre usage n'est qu'occasionnel, vous pourriez souhaiter trouver une alternative moins coûteuse. L'une de ces solutions s'appelle PlayHT. Elle est loin d'être parfaite dans sa formule de base, mais elle a l'avantage d'inclure le clonage de la voix dans son offre d'essai gratuite. Il est possible par ce biais de cloner une seule voix - mais c'est habituellement ce que vous rechercherez - et de l'utiliser sur un volumevolume de texte de 12 500 caractères par mois.

    Mettre en œuvre PlayHT

    L'application PlayHT est disponible ici : https://play.ht/. Inscrivez-vous sur la plateforme, de préférence avec une adresse GoogleGoogle afin de faciliter l'inscription. Sélectionnez ensuite « Create Voice CloneClone » ou bien « Create a New Clone ». Choisissez le mode « Instant ».

    L'étape suivante est majeure : pensez bien à indiquer la langue d'origine et donc très probablement le français en ce qui vous concerne.

    PlayHT vous propose alors deux solutions pour synthétiser votre voix : vous pouvez charger un fichier audio pré-enregistré ou bien brancher un microphone et vous enregistrer sur le vif. Donnez un nom à votre clone vocal. Confirmez que vous avez le droit d'utiliser la matière sonore soumise ici et lancez la génération de votre clone.

    Ici, nous créons un clone vocal appelé Danic à partir d’un fichier pré-enregistré. © PlayHT
    Ici, nous créons un clone vocal appelé Danic à partir d’un fichier pré-enregistré. © PlayHT

    Une fois le clone réalisé, il ne reste plus qu'à le mettre en œuvre. Sélectionnez « Use ». Placez ensuite un texte dans le cadre approprié. Sachez que PlayHT ne pourra cloner qu'un paragraphe à la fois - le processus est assez long. Une fois la génération effectuée, vous pouvez l'écouter. S'il ne vous convient pas, vous pouvez le régénérer et choisir la version adéquate à exporter.

    Il est possible de générer plusieurs fois le texte énoncé par le clone vocal. © PlayHT
    Il est possible de générer plusieurs fois le texte énoncé par le clone vocal. © PlayHT

    Une voix haute fidélité ?

    Il est possible que globalement vous soyez relativement déçu par le résultat. Dans l'exemple que nous avons choisi, nous avons notamment constaté que PlayHT lisait à la française les termes anglais qui pouvaient apparaître dans le texte, n'opérant pas de lui-même l'adaptation nécessaire. Parfois aussi, notre clone vocal a semblé quelque peu éloigné de l'original. Vous pouvez influencer le processus en cliquant sur « Advanced » et en déplaçant le curseur « Similarity » vers la droite - vous pouvez aussi jouer sur la stabilité et l'intensité, puis régénérer l'échantillon vocal.

    Toutefois, pour obtenir un résultat de haute qualité, il faudrait choisir une formule payante et cloner alors votre voix en High Fidelity.