Indexation de documents audio : Cas des grands volumes de données

Toubkal : Le Catalogue National des Thèses et Mémoires

Indexation de documents audio : Cas des grands volumes de données

dc.contributor.author	Rougui, Jamal Eddine
dc.description.collaborator	Aboutajdine, M. D. (Président)
dc.description.collaborator	Mouaddib, N. (Examinateur)
dc.description.collaborator	Mammass, D. (Examinateur)
dc.description.collaborator	Daoudi, K. (Examinateur)
dc.description.collaborator	Gelgon, M. (Examinateur)
dc.description.collaborator	Rziza, M. (Examinateur)
dc.description.collaborator	Mouaddib, El. (Examinateur)
dc.description.collaborator	Garcia, M. B. (Examinateur)
dc.date.accessioned	2021-04-01T14:47:34Z
dc.date.available	2021-04-01T14:47:34Z
dc.date.issued	2008
dc.identifier.uri	http://toubkal.imist.ma/handle/123456789/12919
dc.description.abstract	Cette thèse est consacrée à l'élaboration et l'évaluation des techniques visant à renforcer la robustesse des systèmes d'indexation de documents audio au sens du locuteur. L'indexation audio au sens du locuteur consiste à reconnaître l'identité des locuteurs ainsi que leurs interventions dans un flux continu audio ou dans une base de données d’archives audio, ne contenant que la parole. Dans ce cadre nous avons choisi de structurer les documents audio (restreints à des journaux radiodiffusés) selon une classification en locuteurs. La technique utilisée repose sur l’extraction des coefficients mel-cepstrales, suivi par l’apprentissage statistique de modèles de mélange de gaussiennes (MMG) et sur la détection des changements de locuteur au moyen de tests d'hypothèses Bayésiens. Le processus est incrémental : au fur et à mesure que de nouveaux locuteurs sont détectés, ils sont identifiés à ceux de la base de données ou bien, le cas échéant, de nouvelles entrées sont créées dans la base. L'organisation des MMG des locuteurs en structure arborescente est un choix qui permet de réduire considérablement la complexité du traitement lors du passage à l'échelle incrémentale. Plusieurs techniques ont été réalisées dans ce travail de thèse. Comme toute structure de données adaptée au problème incrémental, notre système d’indexation permet d’effectuer la mise à jour des modèles MMG des locuteurs à l’aide de l’algorithme fusion des MMG. Cet algorithme a été conçu à la fois pour créer une structure ascendante en regroupant deux à deux les modèles GMM jugés similaires. Enfin, au travers de deux expérimentations utilisant des structures arborescentes binaires ou n’aires, une réflexion est conduite afin de trouver une structure ordonnée et adaptée au problème incrémental. Quelques pistes de réflexions sur l'apport de l'analyse vidéo sont discutées et les besoins futurs sont explorés.
dc.publisher	Université Mohammed V - Agdal, Faculté des Sciences, Rabat
dc.relation.ispartofseries	Th-005/ROU
dc.subject	Reconnaissance automatique de locuteur
dc.subject	Base de donnée multimédia
dc.subject	Structuration audiovisuelle
dc.subject	Classification hiérarchique
dc.subject	Modèle de mélange de gaussienne
dc.subject	Divergence de Kullback-Leibler
dc.subject	Architecture arborescente
dc.subject	Informatique
dc.subject	Télécommunication
dc.title	Indexation de documents audio : Cas des grands volumes de données	fr_FR
dc.description.laboratoire	Recherche en Informatique et Télécommunications, (LAB.)
dc.description.laboratoire	Scineces de l'Ingénieur

Files in this item

Files	Size	Format	View
There are no files associated with this item.

This item appears in the following Collection(s)

Faculté des Sciences Agdal de Rabat - Doctorat ou Doctorat National [925]

Show simple item record

Indexation de documents audio : Cas des grands volumes de données

DSpace/Manakin Repository

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

Indexation de documents audio : Cas des grands volumes de données

Files in this item

This item appears in the following Collection(s)

Search DSpace

Browse

All of DSpace

This Collection

My Account