Détection de la langue dans les moteurs de recherche

Par défaut, c'est automatique et presque transparent pour l'utilisateur:

  • Robots : reconnaissent la langue des documents lors de l’indexation
  • Moteurs : n’affichent que les pages correspondant à sa langue lors des requêtes
  • Difficultés : langues / systèmes d’écriture
  • Stratégies d’identification : critères statistiques (fréquences des lettres, bigrammes, trigrammes, mots)

Recherche multilingue:

Il est possible de rechercher des pages dans une autre langue, que l'on ne connait pas:

  1. effectuer une recherche à partir de mots en Français.
  2. votre requête est traduite dans l'autre langue, et des résultats sont cherchés en français et/ou dans cette autre langue.
  3. Enfin, les résultats trouvés sont traduits en français.

Exercice 1:

Rechercher avec le moteur Google (en gardant les options par défaut) la chaine to be or not to be. Combien y a-t-il de résultats?

Recherchez maintenant en choisissant "Pages en langue étrangère traduites" dans la colonne de gauche. Comment a été traduite votre requête? Combien de langues ont été cherchées? Combien y a-t-il de résultats? Cette fonction n'existe plus dans Google, comme le fait remarquer ce site, et il faut procéder en plusieurs étapes.

  • traduire notre requête dans la langue souhaitée
  • effectuer la recherche dans cette langue
  • traduire les pages trouvées

Faites l'exercice avec une autre langue, que vous ne connaissez pas.

Exercice 2:

Mêmes exercices avec la chaine o rage oh désespoir.

Exercice 3:

Mêmes exercices avec la chaine "to be or not to be".

Exercice 4:

Mêmes exercices avec la chaine "oh rage oh désespoir".

Pour en savoir plus sur la recherche multilingue:

Traduction automatique

De nombreuses difficultés apparaissent:

  • Domaine lexical : polysémie/homographie
  • Domaine grammatical : homographes grammaticaux, temps, modalités, constructions verbales, prépositions, etc.
  • Application : acquérir des traductions à partir du Web

Un outil de traduction automatique est proposé par Google. Il suffit de choisir Traduction dans le menu Plus. Yahoo propose Babelfish

Exercice 1:

Rechercher des points fixes dans les traducteurs automatiques avec la phrase "Demain, il fera beau, d'après le bulletin météo. Tout le monde applaudit"

Exercice 2:

Essayez maintenant avec des expressions plus courtes comme "Il fait beau" ou "Il fait frais".

Exercice 3:

Essayez avec des expressions anglaises courtes comme "snare drum" ou "how do you do", ou encore "how are you".

Sites web multilingues

Parallèles ou "Partiellement parallèles"

La suite

Retour à la page du cours.


Cette page est en cours de constitution. Faites moi part de vos remarques à : Joël Quinqueton