Contribution a la reconnaissance hors-ligne d’écriture arabe a base des modèles des markov cachés-semi- continus

dc.contributor.authorM a q q o r, Ahlam
dc.date.accessioned2018-09-25T08:21:38Z
dc.date.accessioned2026-01-26T12:36:30Z
dc.date.available2018-09-25T08:21:38Z
dc.date.issued2014
dc.description.abstractLe but majeur des systèmes de la reconnaissance de l'écriture est de traduire une image de texte imprimé ou manuscrit en un texte codé numériquement et interprétable par un ordina- teur, en transmettant à ce dernier la capacité de lire l’écriture. Pour cela, depuis quelques an- nées et grâce à l’apparition des nouvelles technologies d’information, les chercheurs scienti- fiques ont développé des techniques pour transmettre à l’ordinateur la capacité de lire l’écriture. L’objectif de cette thèse est d’élaborer un système de reconnaissance des mots ma- nuscrits pouvant être appris et appliqués sur différents styles d’écriture. Le travail présenté dans cette thèse est consacré au développement et l’implémentation d’une nouvelle approche basée sur une modélisation analytique markovienne de type semi- continu. Le processus de cette approche se compose, d’une phase de prétraitement, d’une phase d’extraction des caractéristiques et une phase de modélisation. La phase de prétraite- ment comporte la binarisation, la normalisation, la segmentation, et la squelettisation. La phase d’extraction des caractéristiques se base sur un mélange de caractéristiques statistiques et géométriques, à savoir, les densités et les concavités des pixels, les intensités de niveau de gris des pixels, les projections VH2D (Verticale, Horizontale, Diagonale sur 45° et Diagonale sur 135°) et les moments invariants de Hu. Ces caractéristiques sont extraites à l’aide de la technique de fenêtres glissantes, celles-ci parcourent les images des mots dans le sens de lec- ture et découpent implicitement l’image en caractère ou en graphème. L’extraction des ces caractéristiques génère quatre ensembles, chaque ensemble contient une séquence de vecteurs primitives de la forme à reconnaître. La phase de modélisation est basée sur le Modèle de Markov Caché avec l’utilisation de la boite à outils HTK pour l’apprentissage et la reconnais- sance. Chaque caractère est modélisé par un MMC-semi-continus de type Bakis. Chaque en- semble de caractéristiques ayant un MMCs. Enfin, nous avons proposé d’améliorer les per- formances de notre système de reconnaissance d’écriture arabe par l’utilisation des méthodes de combinaisons parallèles des quatre classifieurs de type MMCs ayant la même architecture mais entraînés par quatre différents types de vecteurs primitives. Pour cela plusieurs méthodes de combinaisons parallèles sans apprentissage ont été examinées. Nous avons évalué notre système, en utilisant, la base de donnée IFN/ENIT qui présente une base de données Arabe d’images de noms de villes tunisiennes et la base de données des documents imprimés. Les résultats obtenus montrent que la combinaison de quatre classi- fieurs de type MMCs-semi-continus apporte une amélioration importante de la qualité de re- connaissance de notre système de reconnaissance hors-ligne d’écriture arabe par rapport à chacun des classifieurs individuel.fr_FR
dc.description.collaboratorEl Bekkali, Moulhim (Président)
dc.description.collaboratorSabbane, Mohamed (Rapporteur)
dc.description.collaboratorSbai, El Hassan (Rapporteur)
dc.description.collaboratorBoumhidi, Jaouad (Rapporteur)
dc.description.collaboratorEl Beqqali, Omar (Examinateur)
dc.description.collaboratorTairi, Hamid (Examinateur)
dc.description.collaboratorZarghili, Arsalane (Examinateur)
dc.description.collaboratorSatori, Khalid (Directeur de thèse)
dc.description.laboratoireL I I AN (LAB.)fr_FR
dc.identifier.urihttps://toubkalpreprod.imist.ma/handle/123456789/11432
dc.language.isofrfr_FR
dc.publisherUniversité sidi mohammed ben abdellah, Faculté des sciences Dhar El Mahraz-Fèsfr_FR
dc.subjectReconnaissance d’écriture arabe,fr_FR
dc.subjectFenêtres glissantes,fr_FR
dc.subjectMoments invariants de Hu,fr_FR
dc.subjectApproche VH2D,fr_FR
dc.subjectModèles de Markov Cachés(MMCs),fr_FR
dc.subjectBoite à outils HTK,fr_FR
dc.subjectMéthodes de combinaison par fusion.fr_FR
dc.titleContribution a la reconnaissance hors-ligne d’écriture arabe a base des modèles des markov cachés-semi- continusfr_FR

Files