"Modèles intelligents à base des réseaux de neurones pour la classification des documents textuels"
fr
Loading...
Authors
Collections
Journal Title
Journal ISSN
Volume Title
Publisher
Université Sidi Mohamed Ben Abdellah, Faculté des Sciences - Dhar El Mahraz -, Fès
Department
Supervisor
Date
Abstract
Le nombre de données non structurées forme environ 90% de données disponible sur le web et
sur les supports de stockage. Or la gestion de ce nombre énorme de documents numériques, qui
ne cesse d’évoluer à chaque instant, nécessite les techniques d’intelligence artificielle pour
pouvoir classifier et gérer automatiquement ces données de haute dimension. Nous proposons
des nouveaux modèles intelligents à base des réseaux de neurones artificiels.
Nous avons utilisé dans la première contribution de la présente thèse, d’une part la théorie des
graphes ; précisément le concept de l’ensemble stable maximum (MSSP) pour modéliser le
problème de clustering de texte, et d’autre part les réseaux de Hopfield continu comme réseaux
de neurones, pour détecter automatiquement le nombre de clusters et les centres initiaux du
corpus proposé. Ces derniers seront les paramètres de base de K-Means dans la deuxième
contribution. Notre approche a prouvé son efficacité et sa performance en termes de qualité de
clustering et de temps d’exécution pour les grands ensembles de données.
Dans la dernière partie, nous avons réalisé une synthèse sur la structure et les implémentations
techniques des systèmes de classification de textes basés sur l’apprentissage profond. L’objectif
est d’examiner l'impact de nombreuses représentations de mots par rapport au plongement de
mots contextuelle (BERT) sur la réalisation de classification de textes.
Description
Keywords
Informatique, Apprentissage non supervisé, Analyse de données, Classification, Document clustering, Text mining, Nombre de clusters, K-Means, Ensemble stable maximum, Réseaux de neurones, Réseau de Hopfield, Apprentissage profond, Représentation de texte