Contribution à l’amélioration des techniques de NLP pour la langue Amazigh basée sur Deep Learning

Otman MAAROUF

Contribution à l’amélioration des techniques de NLP pour la langue Amazigh basée sur Deep Learning

dc.contributor.advisor	Rachid EL AYACHI
dc.contributor.author	Otman MAAROUF
dc.date.accessioned	2023-10-31T14:07:24Z
dc.date.accessioned	2025-11-07T11:39:30Z
dc.date.available	2023-10-31T14:07:24Z
dc.date.issued	2023
dc.description.abstract	Dans la recherche scientifique, il y a quelques langues qui sont moins traitées, parmi elles on trouve la langue Amazigh, cette dernière souffre du manque d’outils intelligents de traitement. La résolution de ce problème représente l’objectif de cette thèse, qui s’intéresse à la création d’un framework de TALN (Traitement Automatique de la Langue Naturelle) regroupant un ensemble d’outils pour le traitement de la langue Amazigh. Les tâches du framework réalisées jusqu’à présent sont : la correction de la sortie d’un OCR (Optical Character Recognition), l’étiquetage, la détermination des entités nommées et la traduction. La réalisation de ce framework a nécessité les approches de TALN, Machine Learning et Deep Learning. Comme toutes les langues, un corpus est nécessaire à l’aboutissement d’un projet dans le domaine de TALN, c’est pour cela un corpus annoté de la langue Amazigh écrit en Tifinagh est élaboré. Un OCR est un système qui permet de reconnaitre le contenu d’un document scanné, le résultat de ce système nécessite parfois une correction, alors comme première contribution, une approche de correction est proposée basée sur les n-grammes. Comme deuxième contribution, l’étiquetage morpho-syntaxique est une opération primordiale du TALN, à ce niveau, un ensemble de modèles ont été élaborés et testés afin d’avoir des résultats performants, ces modèles sont basés sur les approches de Machine Learning (Arbre de décision et Conditional Random Fields) et les approches de Deep Learning (RNN, LSTM, GRU et Bi-LSTM). En plus, dans la troisième contribution, le problème de la détermination du type d’entité nommé est résolu via la préparation des données et la proposition de cinq modèles de classification des entités nommées, ces modèles sont fondés sur l’architecture des réseaux de neurones récurrente (RNN, LSTM, GRU, Bi-LSTM et Bi-GRU). La dernière contribution concerne la traduction de la langue Amazigh en Anglais, cet outil a exigé en premier lieu un corpus parallèle Amazigh-Anglais, et en seconde lieu la proposition des modèles de traduction automatique en se basant sur GRU, LSTM et Transformateurs.
dc.description.collaborator	Mohamed FAKIR:Omar BENCHAREF:Mohamed BASLAM:Hicham ZOUGAGH:Yousef EL MOURABIT:Mustapha OUJAOURA:Mohamed BINIZ
dc.identifier.uri	https://toubkal.imist.ma/handle/123456789/25813
dc.identifier.uri	https://doi.org/10.83129/toubkal-3561
dc.language.iso	FR
dc.publisher	Faculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat National	fr_FR
dc.subject	Langue Amazigh	fr_FR
dc.subject	TALN	fr_FR
dc.subject	Machine Learning	fr_FR
dc.subject	Deep Learning	fr_FR
dc.subject	OCR ,POS	fr_FR
dc.subject	Entités Nommées	fr_FR
dc.subject	Machine Translation.	fr_FR
dc.subject.other	1. Natural Sciences
dc.subject.specific	1.2 Computer and information sciences
dc.title	Contribution à l’amélioration des techniques de NLP pour la langue Amazigh basée sur Deep Learning	fr_FR

Files

Original bundle

Now showing 1 - 1 of 1

Name:: 480-23-Otman MAAROUF.pdf
Size:: 4.4 MB
Format:: Adobe Portable Document Format

Download

Collections

Faculté des Sciences et des Techniques, Béni Mellal