Un modèle sémantique pour la recherche d’information en langue arabe

dc.contributor.authorDILEKH Tahar
dc.date.accessioned2023-02-13T08:32:15Z
dc.date.available2023-02-13T08:32:15Z
dc.date.issued9/22/2019
dc.description.abstractLes systèmes de recherche d'information textuelle (SRI) sont conçus pour faciliter l'accès aux informations stockées et l’une des tâches principales d’un SRI est l’indexation, qui consiste à construire des représentations simplifiées (descripteurs) décrivant le contenu informationnel des documents et requêtes en vue de faciliter la recherche. Les systèmes de recherche d’informations classiques reposent sur des approches qui représentent les documents (respectivement requêtes) par des descripteurs extraits à partir de leurs textes. Or, les fréquences de ces descripteurs ne sont pas suffisantes pour identifier les relations exprimées et localiser les informations utiles pour une requête d’utilisateur. Comment alors introduire « plus de sémantique » dans la recherche d’informations et la fouille textuelle ? Quelle sémantique ? Dans cette thèse, nous présenterons des méthodes pour introduire l’aspect sémantique dans la recherche d'information en langue Arabe. L'hypothèse principale est que l'inclusion de connaissances telles que les dictionnaires, les thesaurus et les ontologies dans le processus de recherche d'information peut contribuer à la résolution de problèmes majeurs actuellement rencontrés dans la recherche d'information. Dans ce présent travail, nous proposons un modèle de recherche d’information sémantique dans les documents textuels arabes. Nous étudions des différents algorithmes de lemmatisation qui ont été développés pour la langue Arabe et nous proposons un nouvel algorithme qui peut aider à déterminer le bon lemme avant de faire la désambiguïsation, s'il y aurait une possibilité d'ambiguïté. Nous présentons, également, les éléments fondamentaux qui se trouvent normalement dans les ressources de connaissances pour les SRI sémantique, et nous implémentons une méthode d'indexation sémantique pour la recherche d'information où nous utilisons « le dictionnaire de la langue arabe contemporaine » comme ressource lexicale pour explorer l'impact du passage d'une indexation classique à une indexation sémantique
dc.identifier.urihttp://dspace.univ-batna2.dz/handle/123456789/56
dc.language.isofr
dc.publisherUniversity of Batna 2
dc.titleUn modèle sémantique pour la recherche d’information en langue arabe
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Tahar DILEKH.pdf
Size:
3.59 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: