Etude des systèmes d’analyse et de catégorisation des données non structurées basée sur l’apprentissage artificiel : Applications Text Mining
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Sidi Mohamed Ben Abdellah, Faculté des Sciences et Technique - Saïs- , Fès
Department
Supervisor
Date
Abstract
Cette thèse s’inscrit dans le cadre d’apprentissage artificiel avec des
applications concrètes du domine Texte Mining. Nous avons ainsi proposé des
nouvelles approches en relation avec les applications d'analyse des sentiments telles
que les sentiments des clients de l’entreprise de commerce en ligne, de la
classification automatique et de la catégorisation multiple des textes. Les approches
que nous avons proposées se focalisent, particulièrement, sur l’amélioration des
processus d’extraction des caractéristiques, de même que sur la vectorisation des
textes et la gestion de grande dimensionnalité des descripteurs.
Notre première contribution détermine les mécanismes nécessaires pour
réussir la classification automatique, avec comparaison entre différents systèmes de
classification. L'étude comparative réalisée, a prouvé qu’un bon choix des méthodes
de racinisation, de vectorisation, et d’hybridation des algorithmes d’apprentissage,
influence fortement la performance et la fiabilité de ces systèmes.
La deuxième contribution porte sur la proposition d’une nouvelle approche de
vectorisation probabiliste pour rendre la catégorisation neuronale des textes faisable
et performante.
Dans la troisième contribution, nous avons proposé une amélioration
remarquable des descripteurs flous, avec une automatisation des systèmes
d’inférences flous, ce qui améliore la sélection des règles d’inférence. Cette
proposition renforce la vectorisation floue des textes et améliore le rendement des
classifieurs automatiques.
Une quatrième et dernière contribution, sera présentée dans ce manuscrit,
utilise l'amélioration de la logique floue par la logique Neutrosophique afin de
présenter un nouveau modèle avancé pour la rénovation de la vectorisation floue des
données textuelles. Nous proposons ainsi, la mise en œuvre d’un nouveau descripteur
vectoriel qui se base sur la philosophie Neutrosophique pour représenter les termes
pertinents des bases des données textuelles de références, ce qui permet d’avoir des
systèmes de catégorisation des textes robustes avec des performances captivantes.
L’ensemble des outils, des comparaisons et des résultats avec les nouvelles
contributions suscitées, seront affichés et discutés au sein de ce mémoire.
Description
Keywords
Informatique, Text Mining, Apprentissage Artificiel, Extraction des caractéristiques, Vectorisation des Textes, Logique Floue, Logique Neutrosophique, Descripteur Neutrosophique, Classification multiple, Analyse des sentiments, Hybridation des classifieurs