Dico

Dico est un utilitaire qui permet d'extraire le lexique des formes qui apparaissent au sein d'un texte.

Le site Web, pour télécharger ce logiciel est :

http://www.up.univ-mrs.fr/~veronis/logiciels/Dico/

À la première ouverture du logiciel, vous obtiendrez la fenêtre suivante :

Fenetre 1 - Dico

Ouvrez ensuite un fichier que vous aurez préparé en format texte, à partir d'un logiciel de traitement de textes ou un éditeur de textes quelconque. Où ouvrez-vous le fichier ?

Remarque : il est important que votre fichier soit effectivement en format texte (c'est-à-dire qu'il contienne l'extension .txt).

Une fois le travail terminé dans Dico, vous obtiendrez la fenêtre suivante :

Fenetre 2 - Dico

Dans mon exemple ci-dessus, vous remarquerez qu'il y a 48 082 occurrences et 8 942 formes. À votre avis, quelle est la différence entre occurrences et formes ?

Si vous regardez la fenêtre suivante, vous constaterez que le tri des occurrences a été fait par fréquence décroissante :

Fenetre 3 - Dico

Quelle option devez-vous utiliser pour obtenir ceci? Quel est le nombre d'occurrences de l'élément qui dans ce texte? Comment rebasculer sur le tri alphabétique?

Si on veut rechercher des occurrences à partir d'un certain nombre (par exemple, les occurrences apparaissant plus de deux fois dans le texte et moins de 5 fois), comment mettre en place cette recherche?

Si on veut consigner les résultats dans un ou plusieurs fichiers, on doit mettre en place certaines « options », puis rouvrir le fichier. Trouvez comment modifier ces options.

Par ailleurs, vous pouvez vous servir de « filtres » (restreindre la recherche d'occurrences à l'alpha-numérique, éliminer ou inclure la ponctuation, etc. Remarque : n'activez pas l'option « antidico » que nous n'évoquerons pas) Trouver comment mettre en place ces filtres.

Enfin, vous pouvez activer l'option KWIC. Trouvez à quel endroit vous devez le faire. Que veut dire KWIC ?
Comment enregistrer les résultats des KWIC? À quoi sert cette option?

Après avoir répondu aux questions ci-dessus, vous réfléchirez aux limites de ce type de logiciel.