Extraction des Règles d’Association et Prédiction du Diabète par les Algorithmes de Machine Learning

dc.contributor.advisorRachid EL AYACHI
dc.contributor.authorYoussef FAKIR
dc.date.accessioned2023-10-31T14:07:29Z
dc.date.accessioned2025-11-07T11:39:37Z
dc.date.available2023-10-31T14:07:29Z
dc.date.issued2023
dc.description.abstractLa découverte de connaissances à partir de bases de données médicales est importante pour établir un diagnostic médical efficace. Le but de l'exploration de données est d'extraire des informations de la base de données et de générer une description claire et compréhensible des modèles. Le travail présenté avait un double objectif. Le premier est d’appliquer les outils de clustering et de classification à notre base de données. Le second objectif était d’identifier les variables ayant le plus d’impact sur les patients diabétiques à partir des règles d’association extraites, suite à l’extraction des motifs fréquents par un ensemble d’algorithmes que nous comparons les uns aux autres. Nous avons d'abord converti les attributs numériques en une forme catégorique. Des algorithmes basés sur l’algorithme Apriori ont été utilisés pour générer des règles sur les données relatives au diabète des Indiens Pima, afin de selectionner les algorithmes les plus performants. L'ensemble de données a été extrait du référentiel d'apprentissage automatique UCI contenant un total d'instances 768 et 8 attributs numériques. Nous avons découvert que les étapes de prétraitement, souvent négligées dans la découverte des connaissances sont les éléments les plus critiques pour déterminer le succès d'une application d'exploration de données. Enfin, nous avons généré les règles d'association qui sont utiles pour identifier des associations générales dans les données, afin de comprendre les relations entre les champs mesurés et le fait que le patient développe ou non un diabète. Pour remedier aux limites des algorithmes sur les données massives, nous avons adopté la plateform Spark afin de réduire le temps d’execution. Nous avons appliqué trois algorithmes (YAFIM, DFPS et R APRIORI) sur une base de données des patients diabétiques de 253680 instances. En utilisant les motifs extraits de la base de données PIMA, la prédiction du diabète est effectuée à l'aide des algorithmes d'apprentissage automatique tels que Forêts aléatoires, Decision Tree, les réseaux de neuronnes, Naive Bayes et K-plus proche voisins. Les performances de chaque algorithme sont analysées pour déterminer celui qui présente la meilleure exactitude, précision, sensibilité et spécificité. Nous avons constaté que l’algorithme Forêts aléatoires fonctionne bien que les autres algorithmes avec une exactitude de 88.31%.
dc.description.collaboratorSaid SAFI
dc.description.collaboratorMustapha OUJAOURA
dc.description.collaboratorMohamed BASLAM
dc.description.collaboratorYousef EL MOURABIT
dc.description.collaboratorHicham ZOUGAGH
dc.identifier.urihttps://toubkal.imist.ma/handle/123456789/25839
dc.identifier.urihttps://doi.org/10.83129/toubkal-3754
dc.language.isoFR
dc.publisherFaculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat Nationalfr_FR
dc.subjectataminngfr_FR
dc.subjectmotifsfr_FR
dc.subjectApriorifr_FR
dc.subjectFP-Growthfr_FR
dc.subjectCharmfr_FR
dc.subjectEclatfr_FR
dc.subjectCPF-Growthfr_FR
dc.subjectYafimfr_FR
dc.subjectR Apriorifr_FR
dc.subjectDFPSfr_FR
dc.subjectRégles d’associationfr_FR
dc.subjectAlgorithmes de Machine learningfr_FR
dc.subjectPrédiction du Diabète.fr_FR
dc.subject.other1. Natural Sciences
dc.subject.specific1.2 Computer and information sciences
dc.titleExtraction des Règles d’Association et Prédiction du Diabète par les Algorithmes de Machine Learningfr_FR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
521-23 Youssef FAKIR.pdf
Size:
4.03 MB
Format:
Adobe Portable Document Format