todo

Tirer parti des outils de http//dicts.info/uddl.php

Tirer parti des outils de http//dicts.info/uddl.php Tâche

ça a l'air très bien, on peut choisir les différentes langues : X vers Y, et l'outil : omegawiki, du wiktionnary anglo et de wikipedia . Le dernier (Universal dictionary database)

est malheureusement pour un usage personnel uniquement, et non redistribuable (le message s'affiche quand on veut le télécharger.

Pour le wiktionnary, quand on le télécharge, on lit en premier :

# French-Arabic dictionary created from English Wiktionary

On peut en déduire que le risque de mauvaises traduction est amplifiée, non ? Par compte, pour omegawiki, compte tenu de ce qu'on avait vu sur la structure du dico, il y a des chances que ce risque soit amoindri. De même pour wikipedia, vis à vis des pratiques de liage de pages, les résultats doivent être pas mal, ils ont l'air même très bien, étant donné qu'il y a plusieurs pages pour un même mot en fonction du sens, et que les liens sont vérifiés. Petit exemple du wikipedia (on peut y voir que par exemple pour bourse, c'est le sens économie qui est précisé, et que les différents sens de boussole, l'objet et la constellation, font 2 traducs) :

Bougie Vela (iluminación) Bouleau Betula Boulier Ábaco Bourdon (insecte) Bombus Bourgeoisie Burguesía Bourgmestre Presidente municipal Bourgogne Borgoña Bourka (voile islamique) Burka Bourne-Again shell Bash Bourse (économie) Bolsa de valores Boussole Brújula Boussole (constellation) Brújula (constelación)

De plus le dico celui de wikipedia est particulierement grand (en ayant testé pour l'arabe) vis à vis d'omega wiki et du wiktionnary anglais (mais fr > ar ou l'inverse).

A voir maintenant si c'est facile d'en faire des dict, ling ou xdxf ? automatiquement ? Linguae fait ça ?

Bon faudrait qu'on entre en contact avec ceux de shtooka à ce sujet, qu'en pensez-vous ? (les liens de téléchargement donnent sur http://arael.shtooka.net/test/downloadwiki.php ) Je poste un petit message sur la liste ? On essaie d'avoir le mail de la personne qui a fait ces scripts ?

Voilà le lien : http://dicts.info/uddl.php

A noter aussi ce lien, quelqu'un l'avait déjà exploré ? http://dicts.info/dictionaries.php

Il donne notamment sur http://www.papillon-dictionary.org/papillon/Home.po mais ils ont une drôle d'interprétation de l'opensource (non commercial), on pourra les contacter à l'occasion, ils ont l'air de bien aimer linux.

Réponse Christophe :

il faudrait bien comprendre lien entre dicts.info et shtooka. j'ai pas trop le temps de regarder en détail en ce moment (j'essaie toujours d'avancer sur les wiktionnaires!) , mais je garde ça dans un coin…

A voir maintenant si c'est facile d'en faire des dict, ling ou xdxf ? automatiquement ? Linguae fait ça ?

si ce sont de simples fichiers textes avec séparateurs, je pense que linguae doit faire ça. ou sinon tabfile en ligne de commandes permet de le mettra au format stardict/m . http://polyglotte.tuxfamily.org/doku.php?id=logiciels:polyglotte:conversion_dicos#tabfile

a+ Christophe

Discussion

Ghislain, 2010/11/11 19:08

Réponse de Nicolas sur l'origine du script

En réalité l'outil dont tu parles, n'est pas vraiment développé par Shtooka. En réalité, il s'agit d'un contact tchèque que nous avons dépanné il y a quelques années en lui offrant un petit espace d'hébergement. Après une courte recherche, je n'ai pas réussi à retrouver son adresse e-mail (mais peut-être qu'en cherchant plus longuement…) mais voici sa page d'utilisateur sur wiktionary.org: http://en.wiktionary.org/wiki/User:Arael à très bientôt (pour les autres mails) Nicolas Vion pour l'Association Shtooka

 
todo/tirer_parti_des_outils_de_http_dicts.info_uddl.php.txt · Dernière modification: 2010/09/23 12:12 par ghislain
 
Sauf mention contraire, le contenu de ce wiki est placé sous la licence suivante :CC Attribution-Share Alike 3.0 Unported
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki