| Télécharger (zip, 54ko) |
Fréquences des mots en français parlé ===================================== Ce fichier comporte les fréquences des formes (non lemmatisées) dans un corpus de français parlé d'un million de mots (Corpaix, version mai 2000). Seules les formes de fréquence supérieure à 10 ont été listées. Ces données peuvent être utilisées librement, ainsi que redistribuées. Dans ce dernier cas, la présente notice doit impérativement être jointe à la redistribution. Merci de citer l'utilisation de ces données dans vos publications! Jean Véronis, Professeur de Linguistique et Informatique Université de Provence 29 av. Robert Schuman 13621 Aix-en-Provence Cedex 1, France Jean.Veronis@up.univ-mrs.fr http://www.up.univ-mrs.fr/~veronis