Contribution à l’amélioration des techniques de NLP pour la langue Amazigh basée sur Deep Learning

dc.contributor.advisorRachid EL AYACHI
dc.contributor.authorOtman MAAROUF
dc.date.accessioned2023-10-31T14:07:24Z
dc.date.accessioned2025-11-07T11:39:30Z
dc.date.available2023-10-31T14:07:24Z
dc.date.issued2023
dc.description.abstractDans la recherche scientifique, il y a quelques langues qui sont moins traitées, parmi elles on trouve la langue Amazigh, cette dernière souffre du manque d’outils intelligents de traitement. La résolution de ce problème représente l’objectif de cette thèse, qui s’intéresse à la création d’un framework de TALN (Traitement Automatique de la Langue Naturelle) regroupant un ensemble d’outils pour le traitement de la langue Amazigh. Les tâches du framework réalisées jusqu’à présent sont : la correction de la sortie d’un OCR (Optical Character Recognition), l’étiquetage, la détermination des entités nommées et la traduction. La réalisation de ce framework a nécessité les approches de TALN, Machine Learning et Deep Learning. Comme toutes les langues, un corpus est nécessaire à l’aboutissement d’un projet dans le domaine de TALN, c’est pour cela un corpus annoté de la langue Amazigh écrit en Tifinagh est élaboré. Un OCR est un système qui permet de reconnaitre le contenu d’un document scanné, le résultat de ce système nécessite parfois une correction, alors comme première contribution, une approche de correction est proposée basée sur les n-grammes. Comme deuxième contribution, l’étiquetage morpho-syntaxique est une opération primordiale du TALN, à ce niveau, un ensemble de modèles ont été élaborés et testés afin d’avoir des résultats performants, ces modèles sont basés sur les approches de Machine Learning (Arbre de décision et Conditional Random Fields) et les approches de Deep Learning (RNN, LSTM, GRU et Bi-LSTM). En plus, dans la troisième contribution, le problème de la détermination du type d’entité nommé est résolu via la préparation des données et la proposition de cinq modèles de classification des entités nommées, ces modèles sont fondés sur l’architecture des réseaux de neurones récurrente (RNN, LSTM, GRU, Bi-LSTM et Bi-GRU). La dernière contribution concerne la traduction de la langue Amazigh en Anglais, cet outil a exigé en premier lieu un corpus parallèle Amazigh-Anglais, et en seconde lieu la proposition des modèles de traduction automatique en se basant sur GRU, LSTM et Transformateurs.
dc.description.collaboratorMohamed FAKIR:Omar BENCHAREF:Mohamed BASLAM:Hicham ZOUGAGH:Yousef EL MOURABIT:Mustapha OUJAOURA:Mohamed BINIZ
dc.identifier.urihttps://toubkal.imist.ma/handle/123456789/25813
dc.identifier.urihttps://doi.org/10.83129/toubkal-3561
dc.language.isoFR
dc.publisherFaculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat Nationalfr_FR
dc.subjectLangue Amazighfr_FR
dc.subjectTALNfr_FR
dc.subjectMachine Learningfr_FR
dc.subjectDeep Learningfr_FR
dc.subjectOCR ,POSfr_FR
dc.subjectEntités Nomméesfr_FR
dc.subjectMachine Translation.fr_FR
dc.subject.other1. Natural Sciences
dc.subject.specific1.2 Computer and information sciences
dc.titleContribution à l’amélioration des techniques de NLP pour la langue Amazigh basée sur Deep Learningfr_FR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
480-23-Otman MAAROUF.pdf
Size:
4.4 MB
Format:
Adobe Portable Document Format