Transcriber

Introduction

Présentation du logiciel

Comme son nom l'indique, Transcriber est un logiciel libre de transcription de fichiers audio. Il permet donc d'associer des bouts de discours/conversations audios, au texte correspondant. Il fonctionne sous Linux, MacOS X et Windows.

Cette capture d'écran a déjà dû vous en apprendre beaucoup sur la nature du logiciel. Il est important de comprendre que, quand le travail est bien fait, le texte et l'audio sont synchronisés. Ainsi, sélectionner une ligne particulière dans la partie supérieure de la fenêtre, modifiera la position du curseur de lecture sur la partie basse de la fenêtre. Le raccourci clavier Maj+Tab vous permettra de ne lire que le son correspondant à cette ligne (Ctrl+Entrée permet de lire la ligne suivante; un simple pression de la touche Tab démarre la lecture depuis la position du curseur jusqu'à la fin de l'audio). De la même façon, modifier la position du curseur de lecture dans la partie basse de la fenêtre, modifiera la ligne de texte sélectionnée dans la partie supérieure de la fenêtre.

Transcriber enregistre ses transcriptions en XML, et plus précisément au format *.trs, qui associe à chaque ligne de texte l'intervalle de temps correspondant.

Et l'apprentissage de langues étrangères dans tout cela ?

Une fois un fichier audio étranger et sa transcription (typiquement en *.txt, *.html ou *.pdf) récupérée sur le net ou ailleurs, il est possible de :

  1. faire une bonne vieille dictée (phase de transcription). Elle fait donc travailler la reconnaissance sonore, l'orthographe et bien d'autres choses. La correction s'effectue à partir du fichier de texte (*.txt, *.html, *.pdf ou autre) précédemment récupéré
  2. une fois l'audio transcrit au format *.trs de Transcriber, il est alors très commode d'utiliser ce travail pour travailler sa diction en écoutant les phrases ou des bouts de phrases et en les répétant. L'idéal est d'enregistrer sa voix à l'aide d'un micro et d'un autre logiciel (comme Audacity) et de la comparer à celle du locuteur natif. On prend alors conscience de beaucoup de défauts.

Pour résumer, pour notre usage, Transcriber sera un outil extrêmement puissant de reconnaissance sonore, et de prononciation de conversations/discours.

Il s'avère être le complément idéal de l'extension Swac pour Anki et de Shooka-repeat/Swac-repeat car ces derniers permettent de surtout reconnaitre/prononcer des mots seuls, à partir de collections spécifiques, quand ce premier fait le même travail mais pour des séries de mots à partir de n'importe quel type de fichier audio sonore. C'est notamment très utile pour une langue comme l'anglais où selon les mots ne sont pas prononcés à la même vitesse selon leur nature (auxiliaire, nom, pronom …). Dans ces conditions, connaitre la sonorité de tous les mots d'une phrase est nécessaire mais ne suffit pas à la prononcer correctement.

Installation

Vous pouvez télécharger Transcriber ici.

Fonctionnement

Obtenir le matériel brut

La première chose à faire est de trouver et de récupérer un fichier audio étranger accompagné du texte correspondant (typiquement au format *.txt, *.html ou *.pdf). On peut ça relativement facilement sur internet. Voir la section Ressources.

Mode Dictée

Pour notre usage, une méthode de transcription efficace d'un audio serait de :

  1. le segmenter en frontières à chaque pause, silence, respiration, changement de locuteur. Chaque frontière créée correspond à une ligne commençant par un cercle dans la zone de texte et par l'ajout d'un segment dans la zone verte en bas de la fenêtre.
  2. le segmenter en tours de parole à chaque changement d'intervenant
  3. écrire le texte de chaque section élémentaire

Je ne rentrerai pas davantage dans les détails. Tout est expliqué dans cet excellent tutoriel français. Vous n'êtes pas obligé de tout lire. Vous pouvez vous arrêter à la fin de la section 2.5.

Regarder l'oscillogramme lors de la phase découpe (création de tous les segments élémentaires) permet d'anticiper l'ajout de frontières pendant la lecture de l'audio (il suffit de repérer les zones dépourvues d'onde) et donc de gagner un temps précieux sur la première étape préparatoire à la transcription.

Il est possible d'ajouter des annotations supplémentaires au texte brut sous forme de balises (voir première capture de fenêtre). Elles peuvent indiquer des informations comme, une mauvaise prononciation, une partie inaudible, un néologisme … Je m'en sers beaucoup pour noter les mots ou expressions que j'ai eu beaucoup de mal ou que je ne suis pas arrivé à reconnaitre. Je sélectionne alors cette partie du texte, puis, menu Édition → Sélectionner une balise → prononciation → boite de combo → “mal prononcé” → OK, ou plus simplement, après la sélection du texte : maintenez Alt enfoncé et appuyez sur la touche =, puis relâchez Alt et appuyez sur les touches * et Entrée. J'ai donc en quelque sorte détourné le sens des balises. Par exemple [pron=*-]at least[-pron=*], devrait normalement signifié : « mal prononcé » Pour moi, cela signifiera soit « j'ai eu du mal à reconnaitre cette partie », soit « je ne suis pas sûr que ma transcription soit correcte ici ». [pron=*-]???[-pron=*] aurait plutôt signifié « je n'ai rien compris à ce qui a été dit ». Le gros intérêt de tout cela est par exemple, de réessayer plus tard de comprendre un passage audio pour le retranscrire enfin correctement avant de regarder la correction. Pendant la phase de prononciation, nous redoublerons de vigilance à l'approche de tels mots/expressions, car des mots difficiles à reconnaitre sont souvent des mots difficiles à prononcer.

Mode Prononciation

Outils à installer

Outre Transcriber, 2 autres outils sont nécessaires pour travailler au mieux sa diction :

  1. un casque-micro (vous pouvez en trouver des corrects à partir de 20 €, voire moins)
  2. le logiciel Audacity

Vous l'aurez deviné, leur rôle va être d'enregistrer et de répéter votre voix.

Principes généraux

Une fois ces outils installés, nous utilisons la transcription que nous venons de créer. À ce stade, il y a 2 façons de procéder pour améliorer sa diction :

  1. lire à haute voix une ligne de texte de Transcriber et l'enregistrer via Audacity. Il convient ensuite de lire le son que vous venez de produire avec Audacity et de le comparer au son original
  2. faire l'inverse, c'est-à-dire commencer par écouter l'audio original depuis Transcriber et essayer de le reproduire à haute voix avec Audacity.

La première méthode est bien sûr plus difficile que la seconde. Dans les 2 cas, écoutez les audios et enregistrez votre voix jusqu'à ce que vous ayez le sentiment d'avoir prononcé le texte avec suffisamment d'aisance. Enfin… dans l'idéal. Ne vous acharnez pas trop sur une phrase, quand-même.

Vous pouvez annoter (ajouter des balises) à un mot ou une expression difficile à prononcer (si cela n'a pas déjà été fait dans la phase de dictée/transcription). Comme ça vous pouvez retrouver et tenter de reprononcer correctement un passage difficile un autre jour. Le principe a été évoqué dans une note de la partie Mode Dictée. À vous de choisir les balises qui convient le mieux à ce type d'usage.

Considérations techniques

Voilà, les principes sont posés. Il convient maintenant de s'intéresser un peu à la technique pour que la phase de prononciation soit la plus agréable possible. Tout ce qui suit à été pensé pour ne jamais utiliser la souris. Tout peut se faire au clavier. Vous éviterez ainsi peut-être ces satanés troubles musculo-squelettiques.

Je vous conseille de disposer Transcriber et Audacity comme ceci :

Vous remarquerez que la fenêtre d'Audacity empiète sur celle de Transcriber. Ce n'est pas un problème, au contraire. Comme cela, les 2 fenêtres rentrent dans un même écran et on en affiche que les parties utiles pour ce type d'usage. Sous Linux-KDE, il est possible de conserver une fenêtre au-dessus des autres (menu contextuel de la barre de titre → Avancé → Conserver au-dessus des autres). Je trouve cela plus pratique. Sous les autres environnements graphiques, je ne sais pas ce qu'il en est.

Par défaut, les raccourcis claviers de Audacity ne sont pas adaptés à notre usage. Que cela ne tienne, il est possible de charger un fichier de configuration des raccourcis claviers conçu spécialement pour interagir avec Transcriber. Une fois le fichier téléchargé, vous pouvez le charger dans Audacity de la façon suivante :
Menu Edition → Préférences → rubrique “Clavier” → bouton “Charger” → sélectionner le fichier de configuration des raccourcis claviers

Voilà les touches ou les raccourcis claviers qui vous seront utiles :

  • Alt+Tab : passer de la fenêtre de Transcriber à celle d'Audacity et vice-versa

Depuis Transcriber :

  • Maj+Tab : lancer la lecture audio correspondant à la ligne sélectionnée
  • Ctrl+Entrée : lire la suivante

Depuis Audacity :

  • E : enregister votre voix
  • Espace : arrêter l'enregistrement / l'écouter
  • Z puis A : effacer l'oscillogramme

Ressources

anglais

 
logiciels/transcriber.txt · Dernière modification: 2010/05/05 15:09 (modification externe)
 
Sauf mention contraire, le contenu de ce wiki est placé sous la licence suivante :CC Attribution-Share Alike 3.0 Unported
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki