Détection de la langue dans les moteurs de recherche
Par défaut, c'est automatique et presque transparent pour l'utilisateur:
- Robots : reconnaissent la langue des documents lors de l’indexation
- Moteurs : n’affichent que les pages correspondant à sa langue lors des requêtes
- Difficultés : langues / systèmes d’écriture
- Stratégies d’identification : critères statistiques (fréquences des lettres, bigrammes, trigrammes, mots)
Recherche multilingue:
Il est possible de rechercher des pages dans une autre langue, que l'on ne connait pas:
- effectuer une recherche à partir de mots en Français.
- votre requête est traduite dans l'autre langue, et des résultats sont cherchés en français et/ou dans cette autre langue.
- Enfin, les résultats trouvés sont traduits en français.
Exercice 1:
Rechercher avec le moteur Google (en gardant les options par défaut) la chaine to be or not to be. Combien y a-t-il de résultats?
Recherchez maintenant en choisissant "Pages en langue étrangère traduites" dans la colonne de gauche. Comment a été traduite votre requête? Combien de langues ont été cherchées? Combien y a-t-il de résultats?
Cette fonction n'existe plus dans Google, comme le fait remarquer ce site, et il faut procéder en plusieurs étapes.
- traduire notre requête dans la langue souhaitée
- effectuer la recherche dans cette langue
- traduire les pages trouvées
Faites l'exercice avec une autre langue, que vous ne connaissez pas.
Exercice 2:
Mêmes exercices avec la chaine o rage oh désespoir.
Exercice 3:
Mêmes exercices avec la chaine "to be or not to be".
Exercice 4:
Mêmes exercices avec la chaine "oh rage oh désespoir".
Pour en savoir plus sur la recherche multilingue:
- Google : http://www.google.fr/language_tools?hl=fr
- 2lingual (recherche google) : http://www.2lingual.com/
- Projet NeuroWeb.
Traduction automatique
De nombreuses difficultés apparaissent:
- Domaine lexical : polysémie/homographie
- Domaine grammatical : homographes grammaticaux, temps, modalités, constructions verbales, prépositions, etc.
- Application : acquérir des traductions à partir du Web
Un outil de traduction automatique est proposé par Google. Il suffit de choisir Traduction dans le menu Plus. Yahoo propose Babelfish
Exercice 1:
Rechercher des points fixes dans les traducteurs automatiques avec la phrase "Demain, il fera beau, d'après le bulletin météo. Tout le monde applaudit"
Exercice 2:
Essayez maintenant avec des expressions plus courtes comme "Il fait beau" ou "Il fait frais".
Exercice 3:
Essayez avec des expressions anglaises courtes comme "snare drum" ou "how do you do", ou encore "how are you".
Sites web multilingues
Parallèles ou "Partiellement parallèles"
La suite
Retour à la page du cours.
Cette page est en cours de constitution. Faites moi part de vos remarques à : Joël Quinqueton