Vers un méta-moteur de recherche en langue arabe : Racinisation et extension de requêtes
Type de document | Site actuel | Cote | Statut | Date de retour prévue | Code à barres | Réservations |
---|---|---|---|---|---|---|
Thèse universitaire | La bibliothèque des sciences de l'ingénieur | TH-005.741 YOU (Parcourir l'étagère) | Disponible | 0000000014224 |
Sous format papier
Ecole Nationale Supérieur d'Informatique et d'Analyse des Systèmes
À cause de la masse importante d'information qui se trouve actuellement sur internet et qui ne cesse d'augmenter, l'utilisateur a de plus en plus du mal à satisfaire son besoin en information. L'objectif des systèmes de recherche d'information n'est plus l'accès à l'information mais plutôt la recherche et le filtrage des informations réellement pertinentes. Afin d'atteindre cet objectif, un traitement automatique du langage naturel s'avère primordial et d'une importance capitale. La langue arabe est l'une des langues naturelles qui posent de sérieux problèmes et de grands défis dans le domaine du traitement automatique des langues naturelles (TALN). Dans ce travail, nous nous intéressons à la racinisation de la langue arabe, l'un des principaux axes du TALN et l'un des éléments décisifs dans la plupart des systèmes de recherche d'information. Dans le cadre de la recherche d'information en général et la méta-recherche d'information arabe sur internet en particulier, nous proposons une approche, basée sur la racinisation de la langue arabe et la reformulation de requêtes, qui a comme objectif l'amélioration et la promotion de la pertinence d'Astrolab, le méta-moteur de recherche d'information développé antérieurement par notre équipe de travail. Beaucoup d'approches de racinisation de langues naturelles ont été proposées dans la littérature, mais peu d'entre elles sont opérationnelles pour la langue arabe. Dans ce travail, nous proposons une approche hybride, basée sur la racinisation légère et les automates à états finis, qui permette l'extraction de toutes les éventuelles racines d'un mot donné. En ce qui concerne la reformulation de requêtes, nous adoptons une approche basée sur la technique de réinjection de pertinence automatique qui, à l'aide des racines fournies par le module de racinisation et le méta-moteur Astrolab, reformule la requête initiale de l'utilisateur dans l'objectif d'augmenter le taux de pertinence des résultats renvoyés par les systèmes de recherche d'information. Astrolab est un méta-moteur de recherche d'information dédié à la langue arabe qui a été conçu et développé par notre équipe de travail et nous espérons y contribuer à travers l'intégration de cette approche de reformulation de requêtes afin de répondre le plus fidèlement possible aux requêtes des utilisateurs.
Il n'y a pas de commentaire pour ce document.