Extension et optimisation pour la segmentation de la distance de Kolmogorov-Smirnov
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Paris Dauphine- paris IX
Department
Supervisor
Date
Abstract
La segmentation est une méthode qui entre dans le cadre de l’analyse des données multidimensionnelles ; elle se distingue des autres méthodes lorsqu’on passe à la phase descirptive des résultats. La segmentation est, d’une part, une méthode exploratoire et descriptive permettant de résumer et structurer, sous la forme d’un arbre binaire, un ensemble d’observations multidimensionnelles.
D’autre part, c’est un outil décisionnel et inférentiel visant à produire une règle de classement sur les objets appartenant à une partition connue a priori.
En pratique, plusieurs travaux sur la segmentation ont conduit récemment à développer es algorithmes d’aspects exploratoire et décisionnel, souvent fiables et efficaces. On rencontre de nombreuses applications réalisées dans divers domaines tels que la médecine, la biologie ou la reconnaissance des formes. Dans cette thèse, on s’intéresse au critère de Kolmogorov-Smirnov qui fait partie des outils de la segmentation sur les variables quantitatives. Plusieurs simulations ont conclu positivement, tant sur son pouvoir de discrimination assez puissant que sur sa robustesse et son efficacité asymptotique au sens de Bayes. La première phase de ce travail est consacrée à l’extension de ce critère aux variables qualitatives et aux propriétés asymptotiques. La deuxième phase porte sur la réduction de la complexité exponentielle pour la recherche d’une solution globalement optimale à une complexité polynomiale de degré trois. La phase finale s’intéresse à la programmation de ce critère et à son intégration dans le logiciel SICLA (Système Interactif de Classification Automatique)
Description
Keywords
Segmentation, Analyse des données, Arbres binaires, Classification, Kolmogorov-Smirnov