Analyse Syntactico-sémantique automatique de la langue Amazighe

DSpace/Manakin Repository

Aide Aide Aide

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

Analyse Syntactico-sémantique automatique de la langue Amazighe

Show full item record


Title: Analyse Syntactico-sémantique automatique de la langue Amazighe
Author: TALHA Meryem
Abstract: Face à l’afflux de données textuelles en langue amazighe et à leur diversité, il est nécessaire de mettre au point des systèmes adéquats pour y rechercher des informations. La reconnaissance des Entités Nommées (REN) en langue amazighe s’avère un prétraitement éventuellement essentiel pour de nombreuses applications du traitement automatique des langues (TAL). Dans ce mémoire de thèse, nous présentons une chaîne de reconnaissance des entités nommées (personnes, lieux, organisations, dates, expressions numériques, monnaies et pourcentages) en amazighe fondée sur une étude synthétique des spécificités de la langue et des entités nommées en amazighe. Dans cette perspective, nous avons d’abord construit manuellement un corpus que nous avons nommé « AMCorp ». Ce corpus est utilisé pour évaluer les résultats de nos systèmes. Les évaluations tenues ont été étaient basées sur les métriques classiques, qui sont: la précision, le rappel et la F-mesure. Trois axes de recherche ont par conséquent été investis durant ce travail de thèse : En première partie, nous avons proposé un système basé sur une approche à base de règles, fondée sur un ensemble de règles linguistiques et un ensemble de lexiques créés manuellement. Cette approche a donné des résultats promoteurs, mais en ce qui concerne les textes amazighs elle reste restreinte. En une seconde étape, nous avons proposé un système de reconnaissance basé sur une approche d’apprentissage automatique supervisé, nous avons utilisé le SVM comme classifieur ainsi qu’un ensemble de caractéristiques de mots amazighes. Les résultats obtenus montrent qu’il est ainsi possible de reconnaitre les entités nommées amazighes avec une très bonne f-mesure. Les résultats encourageants sur la première et la deuxième approche nous ont poussé à combiner les deux approches précédentes afin d’améliorer le taux de reconnaissance des entités nommées amazighes. La méthode donne des résultats satisfaisants et surpasse la performance des deux autres précédentes.
Date: 2019-07-10

Files in this item

Files Size Format View
THESE_TALHA.pdf 2.980Mb PDF View/Open or Preview

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account