Reconnaissance de caractères imprimés et manuscrits,textes et documents basée sur les modèles de Markov cachés
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Ibnou Zohr, Faculté des Sciences, Agadir
Department
Supervisor
Date
Abstract
Les travaux présentés dans cette thèse se situent dans le cadre de la reconnaissance de
l’écriture manuscrite et imprimée par les Modèles de Markov cachés. Celle-ci consiste à
mieux déchiffrer les caractères présents dans l’image.
Dans un premier temps, nous proposons un système de reconnaissance de caractères
manuscrits isolés, basé sur une modélisation markovienne de type modèle discriminant
(MD- HMM). L’accumulateur de Hough de chaque image de caractère est partitionné en
fenêtres verticales, qui nous utiliserons pour extraire une information directionnelle.
L’information obtenue est traduite en séquences d’observations qui sont utilisées pour
entraîner le modèle de chaque caractère lors de la phase d’apprentissage. L’évaluation du
système de reconnaissance proposé est menée sur une base locale des caractères arabes
manuscrits isolés et la base AMHCD des caractères amazighes manuscrits. Les résultats
enregistrés montrent l’efficacité de la modélisation proposée, notamment dans le cas
continu, où les densités de probabilités sont modélisées par les gaussiennes.
En second temps, nous présentons une nouvelle méthode pour la reconnaissance
automatique hors ligne de caractères Tifinaghs imprimés. La méthode proposée est basée
sur un chemin discriminant (DP-HMM) opérant sur un vocabulaire de base formé de
différents graphèmes fondamentaux. Ce vocabulaire est généré en se basant sur les
caractéristiques morphologiques de la graphie Amazighe. Un seul modèle HMM globale
construit et entraîné sur les éléments du vocabulaire proposé par des primitives structurelles
et géométriques. Chaque chemin au long de ce treillis représente une séquence de
segments, qui constitue un caractère de l’alphabet tifinagh. Pour se faire, les caractères
d’entrés sont pré classés en deux groupes (forme circulaire et non circulaire) et par la suite
sont décrits par leurs points d’intérêts et leurs segments. La reconnaissance s’effectue en
décodant dynamiquement le chemin optimal suivant le critère de maximum de
vraisemblance. Les scores obtenus montent la robustesse de l’approche proposée.
Description
Keywords
Informatique, Modèle de Markov caché, Reconnaissance de l’écriture manuscrite et imprimée, Primitive structurelle, Primitive directionnelle, Transformation de Hough