Contributions à l’Accès à l’Information en Langue Arabe : Regroupement Thématique des Résultats de Recherche et Indexation à base des Phrases-Clés

dc.contributor.authorSahmoudi Issam
dc.date.accessioned2019-12-10T10:16:33Z
dc.date.accessioned2026-01-26T12:31:13Z
dc.date.available2019-12-10T10:16:33Z
dc.date.issued2018-07-07
dc.description.abstractCette thèse s’inscrit dans le cadre d’un projet, qui vise à améliorer les différents composants d’un Système d’Indexation et de Recherche d’Information pour la langue arabe, dans le but de remédier aux différents problèmes résultant de la complexité de cette langue dans le domaine de la fouille de textes. Pour cette raison, dans notre travail et lors de l’élaboration de l’état d’art et l’étude des systèmes existants, nous avons pu recenser et catégoriser l’ensemble des problèmes liés d’une part au processus de consultation des résultats de recherche web et d’autre part au processus d’indexation des documents. Notons que dans le cadre de la consultation, les moteurs de recherche existants tel que Google, Yahoo, Bing retournent une liste ordonnée d’une dizaine de milliers de snippets (métas-données), les utilisateurs ne consultent que les premières pages, et par conséquent les documents situés à la fin de la liste que très rarement consultables bien qu’ils puissent être pertinents. Au niveau du processus d’indexation, la méthode d’indexation basée sur les mots-clés pose un problème d’ambiguïté, ce qui influence négativement les résultats des systèmes de recherche d’information pour les différentes langues en particulier la langue arabe. Pour remédier aux problèmes de consultation et d’indexation nous proposons dans le cadre de cette thèse différentes contributions pour soutenir le domaine de Recherche d’Information pour la langue arabe. Nous avons commencé par un système basé sur l’algorithme STC « Suffix Tree Clustering », permettant le regroupement thématique des résultats de recherche pour les utilisateurs arabes, une deuxième contribution est un système basé sur le FCA « Formal Concept Analysis » qui permet un regroupement conceptuel et fournit une interface de consultation hiérarchique sur deux niveaux. Après, nous avons proposé une nouvelle approche qui permet l’extraction de phrases-clés, basé sur l’algorithme d’arbre de suffixes dans un nouveau système nommé KpST. Par la suite, nous avons apporté des améliorations au système KpST, en ajoutant une couche de filtrage linguistique, et en utilisant une nouvelle mesure pour le calcul de score basée sur la C-Value, ce système est nommé improved-KpST.fr_FR
dc.description.collaboratorRaïs, Nour Eddine (Président)
dc.description.collaboratorBouzoubaa, Karim (Rapporteur)
dc.description.collaboratorMazroui, Azzeddine (Rapporteur)
dc.description.collaboratorBenabbou, Abderrahim (Rapporteur)
dc.description.collaboratorZinedine, Ahmed (Examinateur)
dc.description.collaboratorLekhouaja, Abdelhak (Examinateur)
dc.description.collaboratorCavalli Sforza, Violetta (Examinateur)
dc.description.collaboratorLachkar, Abdelmonaime (Directeur de la thèse)
dc.description.laboratoireIngénierie, Systèmes et Applications, (LAB.)fr_FR
dc.identifier.urihttps://toubkalpreprod.imist.ma/handle/123456789/12377
dc.language.isofrfr_FR
dc.publisherUniversité Sidi Mohamed Ben Abdellah, Faculté des Sciences et Techniques - Saïs -, Fèsfr_FR
dc.subjectInformatiquefr_FR
dc.subjectSciences de l’ingénieur Sciences Physiquesfr_FR
dc.subjectMathématiquesfr_FR
dc.subjectAccès à l’Information en Langue Arabefr_FR
dc.subjectRegroupement Thématiquefr_FR
dc.subjectIndexation à base des Phrases-Clésfr_FR
dc.titleContributions à l’Accès à l’Information en Langue Arabe : Regroupement Thématique des Résultats de Recherche et Indexation à base des Phrases-Clésfr_FR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
these-USMBA-FST.pdf
Size:
4.22 MB
Format:
Adobe Portable Document Format