Analyse et modélisatin statistique à base des modèles à classes latentes : Adaptation et application aux données massives

DSpace/Manakin Repository

Aide Aide Aide

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

Analyse et modélisatin statistique à base des modèles à classes latentes : Adaptation et application aux données massives

Show full item record


Title: Analyse et modélisatin statistique à base des modèles à classes latentes : Adaptation et application aux données massives
Author: Abarda, Abdallah
Abstract: Cette thèse présente une contribution par une nouvelle modélisation statistique basée sur l’approche de classes latentes LCA. Et également de nouveaux critères d’informations pour le choix de critères par comparaison analytique et numérique. Une telle approche est ainsi appliquée dans les domaines de la description de certains phénomènes tel celui du comportement des internautes et également dans les domaines de l’analyse des données massives à savoir le Big Data. La thèse rappelle les méthodes d’analyse de données statistiques et les algorithmes de classification existants, ainsi que les méthodes existantes pour déterminer l’atout de LCA par rapport aux autres méthodes, en expliquant le rôle de chaque méthode dans l’analyse de données. Le travail est concerné ensuite sur les modèles à classes latentes en présentant quelques applications de ces modèles ainsi que les enjeux majeurs y existants, en particulier l’aspect probabiliste des modèles de classes latentes basés sur l’analyse bayésienne, ainsi que l’algorithme EM utilisé pour estimer les paramètres du modèle. Une grande partie de ce travail est consacrée à traiter et répondre à la problématique du choix du nombre de classes dans l’analyse des classes latentes. En outre, cette partie passe en revue quelques critères proposés pour la détermination du nombre de classes. Ainsi, elle présent une contribution par introduction de nouveaux critères d’informations et trace une feuille de route pour le choix de critère par une comparaison analytique et numérique. Ensuite, la thèse propose une nouvelle modélisation statistique d’un phénomène réel en utilisant les modèles à classes latentes, plus spécialement, l’adaptation et l’application de LCA pour l’estimation des classes de personnes à risque d’être victime de la cybercriminalité chez les jeunes internautes marocains. Les données utilisées sont issues d’une enquête réalisée dans le cadre de cette thèse dans plusieurs villes du Maroc. La dernière partie de la thèse décrit l’intérêt du Big Data et la nécessité de trouver des modèles mathématiques et statistiques pour analyser des données de grandes dimensions. Ainsi la thèse présente une contribution de deux nouveaux algorithmes qui facilitent l’analyse de données massives à l’aide de la méthode des classes latentes, et aussi une généralisation pour les techniques statistiques. Les résultats sont validés théoriquement par des études asymptotiques des estimateurs choisis, ainsi que par des simulations numériques.
Date: 2017

Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account