contribution à l’analyse des réseaux sociaux dans un environnement big data
FR
Loading...
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Faculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat National
Department
Supervisor
Date
Abstract
Les réseaux sociaux connaissent une augmentation spectaculaire ces dernières années,
les utilisateurs de ces plates-formes peuvent publier le contenu de leur choix sans en trave, ce qui génère une énorme quantité de données sous forme de tweets, commentaires,
Likes(j’aime), publications sur Facebook, etc. Ces données peuvent être utilisées pour ex traire des informations utiles telles que des sentiments, des opinions ou des motivations.
L’analyse de sentiment (Sentiment Analysis SA) parfois appelée extraction d’opinions
ou en particulier l’analyse des réseaux sociaux (Social Networks Analysis SNA) est un
domaine qui consiste à analyser et à extraire des émotions ou des opinions à partir des
critiques de produits, des critiques de films, des tweets, des publications sur Facebook ; ou
à les classer en classes telles que positive, négative et neutre. Il était devenu un domaine
de recherche scientifique très actif ces dernières années, notamment avec le développement
des réseaux sociaux.
Dans cette thèse, nous utilisons les données provenant des réseaux sociaux (tweets
de Twitter et publications de Facebook) pour les classer et les analyser. Nous décrivons
comment extraire, stocker et analyser ces données à l’aide des technologies Big Data, telles
que le système de fichiers distribué Hadoop HDFS, Apache Flume, Apache Sqoop et le
modèle de programmation MapReduce. Nous présentons également comment préparer
les données pour la classification en appliquant les méthodes de traitement automatique du
langage naturel(NLP). L’objectif de notre travail est de proposer des nouvelles approches
optimales pour analyser et classifier les données des réseaux sociaux en classes(positive,
négative et neutre) d’une manière automatique. Les approches proposées reposent sur
la similarité sémantique, les dictionnaires (AFINN, WordNet et SentiWordNet) et les
concepts de la logique floue. Nous décrivons également comment nous pouvons utiliser
nos approches pour proposer de nouvelles plateformes d’apprentissage en ligne. Notre
travail est développé d’une manière parallèle en répartissant le travail entre plusieurs
machines (cluster Hadoop) à l’aide du HDFS et MapReduce. Les approches proposées
montrent leur efficacité par rapport à quelques méthodes de la littérature et aux méthodes
basées sur l’apprentissage automatique.
Description
Keywords
Mots-clés–Analyse des Réseau Sociaux, Analyse des Sentiments, Big Data, Traite ment du langage Naturel, similarité sémantique, Apprentissage en ligne adaptatif, Sys tèmes de recommandation, Logique floue