Extension et optimisation pour la segmentation de la distance de Kolmogorov-Smirnov

fr
Loading...
Thumbnail Image

Collections

Journal Title

Journal ISSN

Volume Title

Publisher

Université Paris Dauphine- paris IX

Department

Supervisor

Abstract

La segmentation est une méthode qui entre dans le cadre de l’analyse des données multidimensionnelles ; elle se distingue des autres méthodes lorsqu’on passe à la phase descirptive des résultats. La segmentation est, d’une part, une méthode exploratoire et descriptive permettant de résumer et structurer, sous la forme d’un arbre binaire, un ensemble d’observations multidimensionnelles. D’autre part, c’est un outil décisionnel et inférentiel visant à produire une règle de classement sur les objets appartenant à une partition connue a priori. En pratique, plusieurs travaux sur la segmentation ont conduit récemment à développer es algorithmes d’aspects exploratoire et décisionnel, souvent fiables et efficaces. On rencontre de nombreuses applications réalisées dans divers domaines tels que la médecine, la biologie ou la reconnaissance des formes. Dans cette thèse, on s’intéresse au critère de Kolmogorov-Smirnov qui fait partie des outils de la segmentation sur les variables quantitatives. Plusieurs simulations ont conclu positivement, tant sur son pouvoir de discrimination assez puissant que sur sa robustesse et son efficacité asymptotique au sens de Bayes. La première phase de ce travail est consacrée à l’extension de ce critère aux variables qualitatives et aux propriétés asymptotiques. La deuxième phase porte sur la réduction de la complexité exponentielle pour la recherche d’une solution globalement optimale à une complexité polynomiale de degré trois. La phase finale s’intéresse à la programmation de ce critère et à son intégration dans le logiciel SICLA (Système Interactif de Classification Automatique)

Description

Keywords

Segmentation, Analyse des données, Arbres binaires, Classification, Kolmogorov-Smirnov

Citation