Contribution a la reconnaissance hors-ligne d’écriture arabe a base des modèles des markov cachés-semi- continus

DSpace/Manakin Repository

Aide Aide Aide

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

Contribution a la reconnaissance hors-ligne d’écriture arabe a base des modèles des markov cachés-semi- continus

Show full item record


Title: Contribution a la reconnaissance hors-ligne d’écriture arabe a base des modèles des markov cachés-semi- continus
Author: M a q q o r, Ahlam
Abstract: Le but majeur des systèmes de la reconnaissance de l'écriture est de traduire une image de texte imprimé ou manuscrit en un texte codé numériquement et interprétable par un ordina- teur, en transmettant à ce dernier la capacité de lire l’écriture. Pour cela, depuis quelques an- nées et grâce à l’apparition des nouvelles technologies d’information, les chercheurs scienti- fiques ont développé des techniques pour transmettre à l’ordinateur la capacité de lire l’écriture. L’objectif de cette thèse est d’élaborer un système de reconnaissance des mots ma- nuscrits pouvant être appris et appliqués sur différents styles d’écriture. Le travail présenté dans cette thèse est consacré au développement et l’implémentation d’une nouvelle approche basée sur une modélisation analytique markovienne de type semi- continu. Le processus de cette approche se compose, d’une phase de prétraitement, d’une phase d’extraction des caractéristiques et une phase de modélisation. La phase de prétraite- ment comporte la binarisation, la normalisation, la segmentation, et la squelettisation. La phase d’extraction des caractéristiques se base sur un mélange de caractéristiques statistiques et géométriques, à savoir, les densités et les concavités des pixels, les intensités de niveau de gris des pixels, les projections VH2D (Verticale, Horizontale, Diagonale sur 45° et Diagonale sur 135°) et les moments invariants de Hu. Ces caractéristiques sont extraites à l’aide de la technique de fenêtres glissantes, celles-ci parcourent les images des mots dans le sens de lec- ture et découpent implicitement l’image en caractère ou en graphème. L’extraction des ces caractéristiques génère quatre ensembles, chaque ensemble contient une séquence de vecteurs primitives de la forme à reconnaître. La phase de modélisation est basée sur le Modèle de Markov Caché avec l’utilisation de la boite à outils HTK pour l’apprentissage et la reconnais- sance. Chaque caractère est modélisé par un MMC-semi-continus de type Bakis. Chaque en- semble de caractéristiques ayant un MMCs. Enfin, nous avons proposé d’améliorer les per- formances de notre système de reconnaissance d’écriture arabe par l’utilisation des méthodes de combinaisons parallèles des quatre classifieurs de type MMCs ayant la même architecture mais entraînés par quatre différents types de vecteurs primitives. Pour cela plusieurs méthodes de combinaisons parallèles sans apprentissage ont été examinées. Nous avons évalué notre système, en utilisant, la base de donnée IFN/ENIT qui présente une base de données Arabe d’images de noms de villes tunisiennes et la base de données des documents imprimés. Les résultats obtenus montrent que la combinaison de quatre classi- fieurs de type MMCs-semi-continus apporte une amélioration importante de la qualité de re- connaissance de notre système de reconnaissance hors-ligne d’écriture arabe par rapport à chacun des classifieurs individuel.
Date: 2014

Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account