Création automatique de dictionnaires

Dans cette page nous verrons un ou des exemples de création automatique de dictionnaires. Typiquement, il s'agira de: créer un ou des dictionnaires phonétiques ou d'intégrer la phonétique dans un dictionnaire déjà existant; de modifier puis convertir un dictionnaire. Il s'agit en fait de palier au refus de l'auteur d'un dictionnaire de distribuer son travail sous une autre forme. Au cas où cela ne serait pas clair, vous ne pourrez donc pas redistribuer les dictionnaires que vous aurez créés en suivant les indications de cette page.

Phonétique anglaise

Avant tout chose, si vous ne connaissez pas la phonétique anglaise, vous pouvez l'apprendre d'abord ici puis ici.

Voici l'adresse du dictionnaire phonétique des presses d'Oxford. Il est diffusé dans un format texte qui lui est propre. Pour qu'il soit utilisable sous les logiciel Stardict ou QStardict, il est nécessaire de le transformer. N'ayant pas obtenu l'autorisation des presses d'Oxford pour distribuer directement le dictionnaire sous un autre format, je vous ai fait un script pour le faire vous-même sans trop de difficultés. Par contre, étant donné qu'il utilise certains exécutables Unix (tabfile et stardict2txt du paquet stardict-tools), il ne fonctionne que sous Linux.

Voici les étapes préparatoires :

  1. D'abord, téléchargez et décompressez le dictionnaire d'Oxford. Cela créera un répertoire epd.
  2. Entrez ensuite dans le répertoire epd/lexicons avec un gestionnaire de fichier. Il doit contenir le fichier epd. C'est le dictionnaire d'Oxford d'origine.
  3. Téléchargez et placez le script de conversion conv-oxford-sampa2api.py dans epd/lexicons.
  4. Si vous souhaitez insérer la phonétique dans un dictionnaire anglais qui en est dépourvu, vous pouvez par exemple téléchargez le dictionnaire woaifayu (format *.dict, 43000 termes), placez-le toujours dans epd/lexicons et décompressez-le si besoin est.

Voilà ce que cela donne chez moi :

Il n'y a plus qu'à ouvrir un terminal (comme celui qui est intégré au gestionnaire de fichier dans la capture de fenêtre) au même emplacement et taper une des commandes suivantes.

Pour créer un dictionnaire anglais purement phonétique :

python conv-oxford-sampa2api.py -i epd -o phonetique_en_oxford

… où epd et le fichier phonétique d'Oxford et phonetique_en_oxford le répertoire du dictionnaire de type Stardict purement phonétique qui sera créé.

Pour ajouter la phonétique à un dictionnaire anglais existant :

python conv-oxford-sampa2api.py -m stardict-woaifayu-ef-2.4.2/woaifayu-ef.ifo -i epd -o woaifayu-en-fr_api

… où stardict-woaifayu-ef-2.4.2/woaifayu-ef.ifo est le chemin du *.ifo qui identifie le dictionnaire auquel on veut insérer la phonétique, et woaifayu-en-fr_api le répertoire du dictionnaire de type Stardict qui contiendra la définition et la phonétique (il s'agit en fait d'une fusion des 2 dictionnaires).

Si vous voulez faire la même chose à partir d'un dictionnaire au format tabulé (désigne un fichier texte contenant une expression séparée de sa définition par une tabulation pour chacune de ses lignes):

python conv-oxford-sampa2api.py -m woaifayu-ef.tab -i epd -o woaifayu-en-fr_api

… où woaifayu-ef.tab est la forme tabulée du dictionnaire auquel on souhaite ajouter la phonétique.

Pour obtenir le fichier tabulé *.tab final dans le répertoire du dictionnaire en même temps que le *.dict, ajouter l'option ”-t”.

Pour afficher l'aide complète :

python conv-oxford-sampa2api.py -h

Voilà ce que j'obtiens après les conversions:

Il n'y a plus qu'à déplacer les répertoires des dictionnaires phonetique_en_oxford et woaifayu-en-fr_api (voire le stardict-woaifayu-ef-2.4.2 d'origine à titre de comparaison) dans le répertoire des dictionnaire de stardict ”/home/votre_identifiant/.stardict/dic/”.

Et voilà le résultat avec QStardict :

Comme vous le voyez, quand un mot a plus d'une prononciation (ce qui n'est pas rare en anglais), elles sont toutes indiquées. Pour l'anecdote, progress se prononce différemment selon qu'il est employé en tant que nom ou que verbe.

Il est possible de renommer un dictionnaire (ce qui apparait en bleu dans la précédente capture de fenêtre) en modifiant la valeur de la variable bookname de son fichier *.ifo

 
logiciels/polyglotte/creation_dicos.txt · Dernière modification: 2010/05/05 15:09 (modification externe)
 
Sauf mention contraire, le contenu de ce wiki est placé sous la licence suivante :CC Attribution-Share Alike 3.0 Unported
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki