J'ai besoin d'une liste complète de mots tchèques. Par complète, j'entends une liste (un mot par ligne) qui couvre au moins plus de 70 000 mots. Existe-t-il un moyen d'ajouter le tchèque à /usr/share/dict ? Je ne trouve aucune ressource dans le programme d'installation des paquets d'ubuntu (les autres langues sont couvertes mais pas le tchèque) et Google ne m'a pas aidé !
Réponses
Trop de publicités?Tchèque dictionnaire pour myspell ( myspell-cs ) et le dictionnaire tchèque pour GNU Aspell ( aspell-cs ) peut être installé à partir des dépôts par défaut dans toutes les versions d'Ubuntu actuellement prises en charge. Pour installer l'un ou l'autre des paquets de dictionnaires tchèques, exécutez l'une des deux options suivantes sudo apt install myspell-cs
o sudo apt install aspell-cs
Il existe une liste de 166 566 mots tchèques sur le site : https://raw.githubusercontent.com/titoBouzout/Dictionaries/master/Czech.dic . Cette liste ne contient que des mots et ne comprend pas les définitions des mots de la liste.
J'avais aussi besoin de rechercher des mots spécifiques dans tout le dictionnaire tchèque et j'ai utilisé aspell
contenant 3.1M de mots tchèques.
$apt install aspell aspell-cs
$aspell -d cs dump master | aspell -l cs expand | wc -l
3141344
$aspell -d cs dump master | aspell -l cs expand | egrep ".{30,}" | wc -l
110
Cela montre le nombre total de mots de plus de 30 caractères. Vous pouvez jouer avec différents motifs grep pour trouver les mots manquants dans les mots croisés :-)
Source : https://superuser.com/questions/137957/how-to-convert-aspell-dictionary-to-simple-list-of-words