Important : pour lire correctement les lettres accentuées et autres caractères spéciaux dans les listes qui suivent, configurez votre navigateur Internet pour afficher l'utf-8 (Firefox : menu “Affichage” > “Encodage des caractères” > Unicode (UTF-8); Konqueror : Ouvrir avec “Kate”… etc.)
J'ai récupéré sur le site latine loquere la liste du vocabulaire à connaître en latin (enseignement Français) pour le collège (5ème, 4ème, 3ème) : voici les fichiers textes que j'en ai tirés.
Copyleft avec 135K mots français catégorisés
Projet liste simple de 1500 mots environ. En cours de réalisation. Après un premier travail, nous avons obtenu une liste de 1364 mots. Cette liste a été complétée par ajout des mots manquants des “séries” incomplètes (adjectifs numéraux, mois, saisons, couleurs, mots de salutation ou de politesse … etc.), et mots de la liste “207 mots” de Swadesh pour le français (http://fr.wikipedia.org/wiki/Liste_Swadesh). Avec ces ajouts, la liste compte 1414 mots. D'autres mots pourraient encore être ajoutés s'ils sont importants à connaître dès le premier apprentissage d'une langue.
Il faudrait sans doute affiner encore. Un code grammatical est indiqué pour chaque mot. On a parfois distingué des homonymes (le nom masculin “pas” et l'adverbe de négation “pas”), mais le plus souvent, on a seulement indiqué différents codes pour un même mot (beaucoup de mots sont à la fois des noms et des adjectifs, parfois des noms et des verbes, comme par exemple “pouvoir”). Certains mots ont de multiples sens. L'exemple de la liste Swadesh est à ce titre intéressante : elle précise le sens le plus courant de chacun des mots qu'elle retient. Il ne suffit donc pas de réaliser une liste de 1500 mots environ… mais il faudrait réaliser à partir de là une liste de mots associés à la signification pour laquelle ils sont le plus souvent employés (ou aux significations pour lesquelles ils sont le plus souvent employés, si plusieurs sont fréquentes).
se décomposant comme suit :