Traitement automatique des langues et recherche d’information en langue arabe dans un domaine de spécialité : Apport des connaissances morphologiques et syntaxiques pour l’indexation

Boulaknadel, Siham

Traitement automatique des langues et recherche d’information en langue arabe dans un domaine de spécialité : Apport des connaissances morphologiques et syntaxiques pour l’indexation

dc.contributor.author	Boulaknadel, Siham
dc.date.accessioned	2021-04-01T14:47:33Z
dc.date.accessioned	2026-01-24T08:36:44Z
dc.date.available	2021-04-01T14:47:33Z
dc.date.issued	2008
dc.description.abstract	La Recherche d'information a pour objectif de fournir à un utilisateur un accès facile à l'information qui l'intéresse, cette information étant située dans une masse de documents textuels. Afin d'atteindre cet objectif, un système de recherche d'information doit représenter, stocker et organiser l'information, puis fournir à l'utilisateur les éléments correspondant au besoin d'information exprimé par sa requête. La plupart des systèmes de recherche d'information (SRI) utilisent des termes simples pour indexer et retrouver des documents. Cependant, cette représentation n'est pas assez précise pour représenter le contenu des documents et des requêtes, du fait de l'ambiguïté des termes isolés de leur contexte. Une solution à ce problème consiste à utiliser des termes complexes à la place de termes simples isolés. Cette approche se fonde sur l'hypothèse qu'un terme complexe est moins ambigu qu'un terme simple isolé. Notre thèse s’inscrit dans le cadre de la recherche d’information dans un domaine de spécialité en langue arabe. L'objectif de notre travail a été d’une part,d’identifier les termes complexes présents dans les requêtes et les documents. D’autre part, d'exploiter pleinement la richesse de la langue en combinant plusieurs connaissances linguistiques appartenant aux niveaux morphologique et syntaxique, et de montrer comment l'apport de connaissances morphologiques et syntaxiques permet d'améliorer l'accès à l'information. Ainsi, nous avons proposé une plate-forme intégrant divers composants dans le domaine public ; elle conduit à montrer l'apport significatif et tranché de plusieurs de ces composants. En outre, nous avons avons défini linguistiquement les termes complexes en langue arabe et nous avons développé un système d’identification de termes complexes sur corpus qui produit des résultats de bonne qualité en terme de précision, en s’appuyant sur une approche mixte qui combine modèle statistique et données linguistiques.
dc.description.collaborator	Martinez, J. (Président)
dc.description.collaborator	Hamdani, A. (Examinateur)
dc.description.collaborator	Mothe, J. (Examinateur)
dc.description.collaborator	Daille, B. (Examinateur)
dc.description.collaborator	Aboutajdine, D. (Examinateur)
dc.description.collaborator	Elqadi, A. (Examinateur)
dc.description.laboratoire	Recherche en Informatique et Télécommunications, (LAB.)
dc.identifier.uri	https://toubkal.imist.ma/handle/123456789/12913
dc.identifier.uri	https://doi.org/10.83129/toubkal-14743
dc.publisher	Université Mohammed V - Agdal, Faculté des Sciences, Rabat
dc.relation.ispartofseries	Th-006/BOU
dc.subject	Langue Arabe
dc.subject	Recherche d’information
dc.subject	Terme complexe
dc.subject	Terme simple
dc.subject	Extraction de connaissance
dc.subject	Traitement automatique
dc.subject	Sciences de l'ingénieur
dc.title	Traitement automatique des langues et recherche d’information en langue arabe dans un domaine de spécialité : Apport des connaissances morphologiques et syntaxiques pour l’indexation	fr_FR

Collections

Faculté des Sciences - Rabat

Traitement automatique des langues et recherche d’information en langue arabe dans un domaine de spécialité : Apport des connaissances morphologiques et syntaxiques pour l’indexation

Files

Collections