la reconnaissance automatique des caractères : application au tifinagh et aux chiffres arabes

DSpace/Manakin Repository

Aide Aide Aide

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

la reconnaissance automatique des caractères : application au tifinagh et aux chiffres arabes

Show full item record


Title: la reconnaissance automatique des caractères : application au tifinagh et aux chiffres arabes
Author: BADRE - EDDINE EL KESSAB
Abstract: La reconnaissance automatique des caractères est un traitement informatique qui a pour but de traduire un texte écrit à un texte codé numériquement. Cela veut dire que le système est tout comme le cerveau humain, reconnaît des mots et des phrases existant dans un langage connu plutôt qu’une succession de caractères. Depuis la fin des années 1950, la reconnaissance de caractères est devenue un domaine actif de recherche pour la science informatique. Au début, on pensait qu'il s'agissait d'un problème facile, mais il apparut qu'il s'agissait d'un sujet beaucoup plus laborieux. Il faudra encore de nombreuses décennies aux ordinateurs, s'ils y parviennent un jour, pour lire tous les documents avec la même précision que les êtres humains. Les domaines d’application de la reconnaissance de caractères sont nombreux on peut citer à titre d’exemples la reconnaissance des documents administratifs, la reconnaissance des chèques bancaires, la reconnaissance des signatures, etc. Ce travail de thèse propose deux catégories de systèmes de reconnaissance de caractères, la première catégorie s’intéresse à la reconnaissance des caractères Tifinaghs imprimés, manuscrits et cursifs. Tandis que la deuxième est consacrée à la reconnaissance des chiffres Arabes extraits de la base de données standard MNIST. Avant de citer les différentes méthodologies envisagées pour atteindre notre objectif, donnons d’abord juste un aperçu concernant les trois phases de construction d’un système de reconnaissance de formes :  Le prétraitement qui sert à améliorer la qualité des images à reconnaitre afin de pouvoir les rendre trop lisibles et manipulables par un certain ordinateur, cette amélioration a pour buts la réduction des bruits, l’élimination des informations redondantes et parasites, la correction des formes mal positionnées dans ses images, etc.  L’extraction des primitives servant à extraire des quantités d’informations assez significatives et propres à chacune des formes, ce qui permettra par la suite de réaliser une discrimination inter-formes, ceci par conséquent pourra faciliter l’étape suivante.  L’apprentissage – classification ayant pour objectif de faire ramener un système de reconnaissance capable de mieux apprendre les différentes formes en vue de les bien classifier autrement dit les reconnaitre avec justesse. Notons aussi que pour bien comparer et améliorer les performances des systèmes proposés dans cette thèse, on a pu diversifier les techniques utilisées dans chaque phase. En effet, on a employé dans la première phase les techniques de seuillage, de centrage, de normalisation, d’amincissement et de rotation. En ce qui concerne la deuxième phase on a adopté les méthodes de Morphologie mathématique, le zonage et le zig-zag. Tandis qu’en troisième phase on a agréé le perceptron multicouche, les supports vecteurs machines, les k-plus proches voisins et finalement le modèle de Markov caché. Après avoir mis en œuvre ces systèmes de reconnaissance, on a obtenu des résultats satisfaisants et lorsqu’on a combiné les différentes méthodes utilisées dans chacune des phases, on a réellement pu bien améliorer ces résultats.
Date: 2011

Files in this item

Files Size Format View
59-14 BADRE - EDDINE EL KESSAB.pdf 5.568Mb PDF View/Open or Preview

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account