Dico
Dico est un utilitaire qui permet d'extraire le lexique des formes qui
apparaissent au sein d'un texte.
Le site Web, pour télécharger ce logiciel est :
http://www.up.univ-mrs.fr/~veronis/logiciels/Dico/
À la première ouverture du logiciel, vous
obtiendrez la fenêtre suivante :

Ouvrez ensuite un fichier que vous aurez préparé
en format texte, à partir d'un logiciel de traitement de
textes ou un éditeur de textes quelconque. Où
ouvrez-vous le fichier ?
Remarque
: il est important que votre fichier soit effectivement en format texte
(c'est-à-dire qu'il contienne l'extension .txt).
Une fois le travail terminé dans Dico, vous obtiendrez la
fenêtre suivante :

Dans mon exemple ci-dessus, vous remarquerez qu'il y a 48 082
occurrences et 8 942 formes. À votre avis, quelle est la
différence entre occurrences et formes ?
Si vous regardez la fenêtre suivante, vous constaterez que le
tri des occurrences a été fait par
fréquence décroissante :

Quelle option devez-vous utiliser pour obtenir ceci? Quel est le nombre
d'occurrences de l'élément qui
dans ce texte? Comment rebasculer sur le tri alphabétique?
Si on veut rechercher des occurrences
à partir d'un certain
nombre (par exemple, les occurrences apparaissant plus de deux fois
dans le texte et moins de 5 fois), comment mettre en place cette
recherche?
Si on veut consigner les résultats dans un ou plusieurs
fichiers, on doit mettre en place certaines
« options », puis rouvrir le fichier. Trouvez
comment
modifier ces options.
Par ailleurs, vous pouvez vous servir de « filtres
»
(restreindre la recherche d'occurrences à
l'alpha-numérique, éliminer ou inclure la
ponctuation, etc. Remarque
: n'activez pas l'option
« antidico » que nous n'évoquerons pas)
Trouver comment mettre en place ces filtres.
Enfin, vous pouvez activer l'option KWIC. Trouvez à quel
endroit vous devez le faire. Que veut dire KWIC ?
Comment enregistrer les résultats des KWIC? À
quoi sert cette option?
Après avoir répondu aux questions ci-dessus, vous réfléchirez aux limites de ce type de
logiciel.