Concordancier

Un concordancier est un logiciel qui permet de faire un tri rapide de tous les mots d’un texte (ou d'un ensemble de textes), de situer des mots-pivot en contexte (KWIC – Key word in context, cf. ci-dessous), de compter le nombre d’occurrences, etc. Ce type de logiciel travaille à partir de chaînes de caractères.

Concordance

« En lexicographie, une concordance est un index de mots présentés avec leur contexte. Une fois réalisée, l'indexation des mots d'un texte, d'un auteur, d'une époque fournit des renseignements sur les références des mots et éventuellement sur leur fréquence ; on offre à l'utilisateur la possibilité d'étudier parallèlement les divers emplois du même vocable ». Dictionnaire de linguistique et des sciences du langage (1994),  Paris : Larousse, p. 108.

Un repérage de segments de texte contenant des mots-clefs ou mots-pivots visualisables en contexte.

KWIC

KWIC = Key Word In Context — mot clef en contexte

Dans l'exemple suivant, le mot « garde » apparaît dans la colonne centrale. À partir d'un corpus de textes, on peut demander la visualisation d'une concordance en particulier (comme « garde » dans notre exemple), ou bien demander un tri alphabétique de tous les mots, ou occurrences ; lorsqu'on les visualise de la manière suivante, on appelle cette visualisation « un mot clef en contexte », ou un « KWIC ». Les contextes gauche et droit correspondent à un découpage linéaire du mot clef en contexte avec ce qui le précède ou le suit pour une ligne donnée de texte.

Figure 1, KWIC, pour « garde ». Le logiciel utilisé ici pour l'extraction s'appelle Contextes, de Jean Véronis.

Une fois les KWIC visualisés, on doit pouvoir cliquer sur une ligne spécifique (lignes 1 à 6 dans l'exemple ci-dessus) et ensuite avoir accès au texte intégral, à l'endroit précis où figure la concordance recherchée.

Fréquences

Parfois, on ne souhaite que consulter les fréquences (par ordre croissant, décroissant, alphabétique), c'est à dire avoir accès au nombres de fois qu'un mot ou une forme apparaît dans un texte. Dans ce cas, on ne visualise pas le contexte linéaire :

Figure 2, fréquences par ordre alphabétique. Le logiciel utilisé ici est Dico, de Jean Véronis.

Figure 3, fréquences par ordre décroissant. Le logiciel utilisé ici est Dico, de Jean Véronis.

Lecture, pour comprendre l'utilisation d'un concordancier :

L’apport du concordancier à l’analyse et à la remédiation des erreurs des apprenants dans les forums de discussion en ligne

Joseph RÉZEAU, Université Rennes 2, France