Etude des systèmes d’analyse et de catégorisation des données non structurées basée sur l’apprentissage artificiel : Applications Text Mining

Bounabi Mariem

Etude des systèmes d’analyse et de catégorisation des données non structurées basée sur l’apprentissage artificiel : Applications Text Mining

fr

Authors

Bounabi Mariem

Files

these-USMBA-FST.pdf (2.22 MB)

Collections

Faculté des Sciences et Techniques - Fès

Publisher

Université Sidi Mohamed Ben Abdellah, Faculté des Sciences et Technique - Saïs- , Fès

URI

https://toubkal.imist.ma/handle/123456789/15043
https://doi.org/10.83129/toubkal-20439

Date

2021-11-27

Abstract

Cette thèse s’inscrit dans le cadre d’apprentissage artificiel avec des applications concrètes du domine Texte Mining. Nous avons ainsi proposé des nouvelles approches en relation avec les applications d'analyse des sentiments telles que les sentiments des clients de l’entreprise de commerce en ligne, de la classification automatique et de la catégorisation multiple des textes. Les approches que nous avons proposées se focalisent, particulièrement, sur l’amélioration des processus d’extraction des caractéristiques, de même que sur la vectorisation des textes et la gestion de grande dimensionnalité des descripteurs. Notre première contribution détermine les mécanismes nécessaires pour réussir la classification automatique, avec comparaison entre différents systèmes de classification. L'étude comparative réalisée, a prouvé qu’un bon choix des méthodes de racinisation, de vectorisation, et d’hybridation des algorithmes d’apprentissage, influence fortement la performance et la fiabilité de ces systèmes. La deuxième contribution porte sur la proposition d’une nouvelle approche de vectorisation probabiliste pour rendre la catégorisation neuronale des textes faisable et performante. Dans la troisième contribution, nous avons proposé une amélioration remarquable des descripteurs flous, avec une automatisation des systèmes d’inférences flous, ce qui améliore la sélection des règles d’inférence. Cette proposition renforce la vectorisation floue des textes et améliore le rendement des classifieurs automatiques. Une quatrième et dernière contribution, sera présentée dans ce manuscrit, utilise l'amélioration de la logique floue par la logique Neutrosophique afin de présenter un nouveau modèle avancé pour la rénovation de la vectorisation floue des données textuelles. Nous proposons ainsi, la mise en œuvre d’un nouveau descripteur vectoriel qui se base sur la philosophie Neutrosophique pour représenter les termes pertinents des bases des données textuelles de références, ce qui permet d’avoir des systèmes de catégorisation des textes robustes avec des performances captivantes. L’ensemble des outils, des comparaisons et des résultats avec les nouvelles contributions suscitées, seront affichés et discutés au sein de ce mémoire.

Keywords

Informatique, Text Mining, Apprentissage Artificiel, Extraction des caractéristiques, Vectorisation des Textes, Logique Floue, Logique Neutrosophique, Descripteur Neutrosophique, Classification multiple, Analyse des sentiments, Hybridation des classifieurs

Full item page

Etude des systèmes d’analyse et de catégorisation des données non structurées basée sur l’apprentissage artificiel : Applications Text Mining

Authors

Files

Collections

Journal Title

Journal ISSN

Volume Title

Publisher

Department

Supervisor

URI

Date

Abstract

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By