Toubkal : Le Catalogue National des Thèses et Mémoires
contribution à l’analyse des réseaux sociaux dans un environnement big data
Title: | contribution à l’analyse des réseaux sociaux dans un environnement big data |
Author: | MADANI YOUNESS |
Abstract: | Les réseaux sociaux connaissent une augmentation spectaculaire ces dernières années, les utilisateurs de ces plates-formes peuvent publier le contenu de leur choix sans en trave, ce qui génère une énorme quantité de données sous forme de tweets, commentaires, Likes(j’aime), publications sur Facebook, etc. Ces données peuvent être utilisées pour ex traire des informations utiles telles que des sentiments, des opinions ou des motivations. L’analyse de sentiment (Sentiment Analysis SA) parfois appelée extraction d’opinions ou en particulier l’analyse des réseaux sociaux (Social Networks Analysis SNA) est un domaine qui consiste à analyser et à extraire des émotions ou des opinions à partir des critiques de produits, des critiques de films, des tweets, des publications sur Facebook ; ou à les classer en classes telles que positive, négative et neutre. Il était devenu un domaine de recherche scientifique très actif ces dernières années, notamment avec le développement des réseaux sociaux. Dans cette thèse, nous utilisons les données provenant des réseaux sociaux (tweets de Twitter et publications de Facebook) pour les classer et les analyser. Nous décrivons comment extraire, stocker et analyser ces données à l’aide des technologies Big Data, telles que le système de fichiers distribué Hadoop HDFS, Apache Flume, Apache Sqoop et le modèle de programmation MapReduce. Nous présentons également comment préparer les données pour la classification en appliquant les méthodes de traitement automatique du langage naturel(NLP). L’objectif de notre travail est de proposer des nouvelles approches optimales pour analyser et classifier les données des réseaux sociaux en classes(positive, négative et neutre) d’une manière automatique. Les approches proposées reposent sur la similarité sémantique, les dictionnaires (AFINN, WordNet et SentiWordNet) et les concepts de la logique floue. Nous décrivons également comment nous pouvons utiliser nos approches pour proposer de nouvelles plateformes d’apprentissage en ligne. Notre travail est développé d’une manière parallèle en répartissant le travail entre plusieurs machines (cluster Hadoop) à l’aide du HDFS et MapReduce. Les approches proposées montrent leur efficacité par rapport à quelques méthodes de la littérature et aux méthodes basées sur l’apprentissage automatique. |
Date: | 2019 |
Files in this item
Files | Size | Format | View | |
---|---|---|---|---|
226-19 MADANI YOUNESS.pdf | 2.009Mb |
View/ |
||