Ramzi Abbes
Université de Lyon 2 / ICAR-CNRS
Session TALN poster P1P2 Jeudi 12 Juin - 14h00 17h00
-
papier 1380
Dissymétrie entre l'indexation et la recherche d'information en langue arabe
- Ramzi Abbes ( Université de Lyon 2 / ICAR-CNRS)
- Malek Boualem ( France Télécom R&D)
- Résumé : Les moteurs de recherches sur le web produisent des résultats comparables et assez satisfaisants pour la recherche des documents écrits en caractères latins. Cependant, ils présentent de sérieuses lacunes dès que l'ont s'intéresse à des langues peu dotées ou des langues sémitiques, comme l'arabe. Dans cet article nous présentons une étude qualitative au sujet de la recherche d'information en langue arabe et dans laquelle nous mettons l'accent sur l'insuffisance des outils de recherche actuels, souvent mal adaptés aux spécificités de la langue arabe. Pour argumenter notre analyse, nous présentons des résultats issus d'observations et de tests autour de certains phénomènes linguistiques de l'arabe écrit. Pour la validation des ces observations, nous avons testé essentiellement le moteur de recherche Google.
- article