reconnaissance des caractères manuscrits tifinagh par logique floue et modèles de langage n-grammes

DSpace/Manakin Repository

Aide Aide Aide

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

reconnaissance des caractères manuscrits tifinagh par logique floue et modèles de langage n-grammes

Show simple item record


dc.contributor.advisor Mohamed FAKIR
dc.contributor.author SAID GOUNANE
dc.description.collaborator Mohamed FAKIR
dc.description.collaborator Belaid Bouikhalene
dc.description.collaborator Mostafa jourhmane
dc.description.collaborator Abdellatif Hair
dc.description.collaborator Jilali Antari
dc.description.collaborator Cherki Daoui
dc.description.collaborator Mohamed Sabri
dc.date.accessioned 2023-10-31T14:07:33Z
dc.date.available 2023-10-31T14:07:33Z
dc.date.issued 2015
dc.identifier.uri http://toubkal.imist.ma/handle/123456789/25857
dc.description.abstract Dans la littérature, on trouve une panoplie d’algorithmes et de techniques pour la conception des systèmes de reconnaissance des caractères manuscrits. Le paramétrage de ces systèmes se base sur un ensemble d’algorithmes d’entraînement. Ainsi, ces systèmes peuvent être considérés comme des boîtes noires, ce qui rend leur maintenance une tâche fastidieuse voir même impossible. En outre, une discrimination des caractères basée uniquement sur les connaissances acquises de leurs différentes formes est imparfaite. En effet, dans certains cas, même un être humain n’arrive pas à classer correctement un caractère manuscrit. Ainsi, on a souvent recours au contexte, donc à la position de ce caractère dans le mot et parfois même la position du mot dans la phrase entière pour décider la classe exacte du caractère en question. Ainsi, l’objectif de ce travail de thèse est la mise en œuvre d’un système de reconnaissance automatique hors ligne des caractères manuscrits Tifinagh, transparent, interprétable et maniable par un être humain. Pour aboutir à ce but, nous avons développé un système basé essentiellement sur : (1) une méthode d'extraction des caractéristiques sous forme d'une combinaison linéaire de la méthode des densités de pixels et la méthode des distances des centres de gravité; (2) deux algorithmes de classification connues par leur simplicité d’implémentation et de paramétrage; l’algorithme des c-moyennes floues et l’algorithme des kplus proches voisins flous; et (3) les modèles de langage N-grammes pour représenter les connaissances linguistiques de la langue Amazighe. La phase d'entrainement de ce système se fait en deux étapes : (1) A partir d'une large base d'exemples constituée de 8847 images de caractères manuscrits Tifinagh isolés, développée au laboratoire de Traitement de l'Information et d'Aide à la Décision (TIAD), l’algorithme des c-moyennes floues est utilisé pour éliminer les données redondantes et les intrus et génère ainsi un nombre réduit des prototypes les plus représentatifs possibles; (2) à partir d'un large corpus constitué de 133178 instances des mots Amazighe, on estime les probabilités de tous les Ngrammes possibles. Ainsi, pour une image d’un mot inconnu, l’algorithme des k-plus proches voisins flous génère un ensemble de propositions pour chacun des caractères de ce mot, muni de leurs degrés d’appartenance aux différentes classes. Ensuite, à partir de ces propositions, on construit les ii différents mots possibles avec leur poids. Le modèle N-gramme du langage Amazighe est ensuite utilisé pour attribuer une probabilité à chacun de ces mots. Le produit de cette probabilité et le poids affecté par l’algorithme des k-plus proches voisins sera le facteur clé pour le choix de la séquence des caractères la plus adéquate au mot en question. Enfin, pour tester notre système nous avons construit une autre base de test composée d’un ensemble d’images des mots Amazighe en Tifinagh contenant 3965 caractères. Avec ce système, nous avons obtenu des résultats meilleurs que ceux obtenus par l’algorithme des k-plus proches voisins flous, les perceptrons multicouches ou les SVM.
dc.language.iso FR
dc.publisher Faculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat National fr_FR
dc.subject Reconnaissance de formes fr_FR
dc.subject caractères manuscrits Tifinagh fr_FR
dc.subject distances des centres de gravité fr_FR
dc.subject densité de pixels fr_FR
dc.subject c-moyennes floues fr_FR
dc.subject k-plus proches voisins flous fr_FR
dc.subject modèles Ngrammes fr_FR
dc.subject SVM fr_FR
dc.subject Réseaux de neurones fr_FR
dc.subject MMC. fr_FR
dc.subject.other 2. Engineering and Technology
dc.title reconnaissance des caractères manuscrits tifinagh par logique floue et modèles de langage n-grammes fr_FR
dc.subject.specific 1.2 Computer and information sciences

Files in this item

Files Size Format View
70-15 SAID GOUNANE.pdf 4.700Mb PDF View/Open or Preview

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account