Un modèle sémantique pour la recherche d’information en langue arabe
No Thumbnail Available
Date
9/22/2019
Authors
DILEKH Tahar
Journal Title
Journal ISSN
Volume Title
Publisher
University of Batna 2
Abstract
Les systèmes de recherche d'information textuelle (SRI) sont conçus pour faciliter l'accès aux informations stockées et l’une des tâches principales d’un SRI est l’indexation, qui consiste à construire des représentations simplifiées (descripteurs) décrivant le contenu informationnel des documents et requêtes en vue de faciliter la recherche. Les systèmes de recherche d’informations classiques reposent sur des approches qui représentent les documents (respectivement requêtes) par des descripteurs extraits à partir de leurs textes. Or, les fréquences de ces descripteurs ne sont pas suffisantes pour identifier les relations exprimées et localiser les informations utiles pour une requête d’utilisateur. Comment alors introduire « plus de sémantique » dans la recherche d’informations et la fouille textuelle ? Quelle sémantique ? Dans cette thèse, nous présenterons des méthodes pour introduire l’aspect sémantique dans la recherche d'information en langue Arabe. L'hypothèse principale est que l'inclusion de connaissances telles que les dictionnaires, les thesaurus et les ontologies dans le processus de recherche d'information peut contribuer à la résolution de problèmes majeurs actuellement rencontrés dans la recherche d'information. Dans ce présent travail, nous proposons un modèle de recherche d’information sémantique dans les documents textuels arabes. Nous étudions des différents algorithmes de lemmatisation qui ont été développés pour la langue Arabe et nous proposons un nouvel algorithme qui peut aider à déterminer le bon lemme avant de faire la désambiguïsation, s'il y aurait une possibilité d'ambiguïté. Nous présentons, également, les éléments fondamentaux qui se trouvent normalement dans les ressources de connaissances pour les SRI sémantique, et nous implémentons une méthode d'indexation sémantique pour la recherche d'information où nous utilisons « le dictionnaire de la langue arabe contemporaine » comme ressource lexicale pour explorer l'impact du passage d'une indexation classique à une indexation sémantique