Bien des vidéos Youtube consistent en un discours énoncé par le Youtubeur. Vous pouvez donc gagner à en obtenir une transcription. Voici quatre solutions potentielles pour y parvenir.

Les vidéos Youtube apparaissent à un rythme effréné, couvrant les sujets les plus divers. Et vous n'avez peut-être pas le temps nécessaire de regarder la plupart de celles à même de vous intéresser. Obtenir la transcription et pouvoir la lire lors d'un moment de pause est donc une solution pratique. Il existe quatre types de solution en la matière.

Récupérer la transcription de Youtube

Prenez une vidéo quelconque présente sur Youtube et ouvrez sa description. Au bas de celle-ci (ou juste au-dessous sur un téléphone mobile), vous voyez apparaître la mention Afficher la description. Celle-ci apparaît alors à l'écran et elle suit le défilement de la vidéo. Sur ordinateur, cliquez sur les trois points pour désactiver l'horodatage. Vous pouvez sélectionner l'intégralité de cette transcription afin de la copier dans un document.

Cette transcription correspond aux sous-titres de la vidéo et habituellement, elle est générée de façon automatique par Youtube, et donc avec diverses erreurs d'interprétation. Problème essentiel : elle n'inclut pas des phrases se terminant par des points mais le texte complet, sans ponctuation. Ce texte n'est donc pas facile à lire dans la majorité des cas.

Une fois que l’on sélectionné <em>Afficher la transcription</em> dans Youtube, celle-ci apparaît sur la droite de la vidéo. © Youtube
Une fois que l’on sélectionné Afficher la transcription dans Youtube, celle-ci apparaît sur la droite de la vidéo. © Youtube

Utiliser un plug-in de ChatGPT

Si vous disposez de la version payante de ChatGPT, il est possible d'obtenir un résultat bien meilleur en activant un plugin tel que Video Captions. Cette fois, nous obtenons une transcription découpée sous forme de phrases et d'une qualité habituellement honorable, à défaut d'être parfaite. La marche à suivre pour gérer les plugins est expliquée dans cet article : Comment utiliser les plugins ChatGPT ?

La transcription effectuée par le plugin Video Captions est de qualité honorable. © ChatGPT
La transcription effectuée par le plugin Video Captions est de qualité honorable. © ChatGPT

Utiliser un service de transcription

La troisième solution est un peu plus longue à mette en œuvre mais le résultat est de bonne qualité. Elle consiste à utiliser un service de transcription dédié. Problème : un grand nombre de ces services, comme veed.io ou notta.ai vous demandent de charger la vidéo avant d'opérer une telle transcription. C'est fort peu pratique même s'il existe divers outils ad hoc. Le service happyscribe est plus direct : vous indiquez le lien d'une vidéo Youtube et il se charge de la récupérer. De telles applications sont habituellement payantes mais vous pouvez bénéficier de l'essai gratuit pour en tester les capacités.

Transcription de la vidéo par Happy Scribe. © Happy Scribe
Transcription de la vidéo par Happy Scribe. © Happy Scribe

Cliquez sur Create puis Transcript. Sur la gauche, sélectionnez Link (Youtube), indiquez le lien de la vidéo puis cliquez sur Import. Dans le panneau de droite, choisissez la langue de la vidéo, soit probablement French (Français) puis l'option Standard. Enfin cliquez sur Create. Il faut habituellement patienter quelques minutes avant que l'opération ne soit effectuée. Au bout du compte, vous obtenez les 10 premières minutes de la vidéo converties sous forme de phrases et pouvez obtenir le reste en cliquant sur Finish Transcription.

Habituellement, comme dans les solutions abordées plus haut, ces systèmes de transcription ont avant tout des difficultés à énoncer les noms des marques. Si vos besoins en transcription sont très élevés, vous obtiendrez une transcription sans limitation de durée et avec une qualité meilleure en souscrivant un abonnement - le tarif minimum étant de 17 dollars par mois.

Whisper de OpenAI 

L'outil Whisper de OpenAI (le créateur de ChatGPT) est un outil de transcription de haute qualité, probablement le meilleur du genre. Toutefois, son usage nécessite de maîtriser la programmation Python.

La transcription effectuée par Whisper, à défaut d’être parfaite, figure parmi ce qui se fait de mieux. © Steve Digital
La transcription effectuée par Whisper, à défaut d’être parfaite, figure parmi ce qui se fait de mieux. © Steve Digital

Par bonheur, un développeur, Steve Digital, a réalisé un outil gratuit accessible depuis le site HuggingFace. Indiquez l'URL de votre vidéo Youtube, cliquez sur Transcribe puis soyez extrêmement patient car ce service gère une file d'attente.