"Modèles intelligents à base des réseaux de neurones pour la classification des documents textuels"

Karim Awatif

"Modèles intelligents à base des réseaux de neurones pour la classification des documents textuels"

fr

Authors

Karim Awatif

Files

these-USMBA-FS.pdf (2.48 MB)

Collections

Faculté des Sciences - Dhar El Mahraz - Fès

Publisher

Université Sidi Mohamed Ben Abdellah, Faculté des Sciences - Dhar El Mahraz -, Fès

URI

https://toubkal.imist.ma/handle/123456789/14725
https://doi.org/10.83129/toubkal-19860

Date

2021-04-12

Abstract

Le nombre de données non structurées forme environ 90% de données disponible sur le web et sur les supports de stockage. Or la gestion de ce nombre énorme de documents numériques, qui ne cesse d’évoluer à chaque instant, nécessite les techniques d’intelligence artificielle pour pouvoir classifier et gérer automatiquement ces données de haute dimension. Nous proposons des nouveaux modèles intelligents à base des réseaux de neurones artificiels. Nous avons utilisé dans la première contribution de la présente thèse, d’une part la théorie des graphes ; précisément le concept de l’ensemble stable maximum (MSSP) pour modéliser le problème de clustering de texte, et d’autre part les réseaux de Hopfield continu comme réseaux de neurones, pour détecter automatiquement le nombre de clusters et les centres initiaux du corpus proposé. Ces derniers seront les paramètres de base de K-Means dans la deuxième contribution. Notre approche a prouvé son efficacité et sa performance en termes de qualité de clustering et de temps d’exécution pour les grands ensembles de données. Dans la dernière partie, nous avons réalisé une synthèse sur la structure et les implémentations techniques des systèmes de classification de textes basés sur l’apprentissage profond. L’objectif est d’examiner l'impact de nombreuses représentations de mots par rapport au plongement de mots contextuelle (BERT) sur la réalisation de classification de textes.

Keywords

Informatique, Apprentissage non supervisé, Analyse de données, Classification, Document clustering, Text mining, Nombre de clusters, K-Means, Ensemble stable maximum, Réseaux de neurones, Réseau de Hopfield, Apprentissage profond, Représentation de texte

Full item page

"Modèles intelligents à base des réseaux de neurones pour la classification des documents textuels"

Authors

Files

Collections

Journal Title

Journal ISSN

Volume Title

Publisher

Department

Supervisor

URI

Date

Abstract

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By