Contribution au Développement d’Approches pour la Collecte et l’Extraction de contenue Web.

dc.contributor.advisorMohamed FAKIR
dc.contributor.authorJABIR BRAHIM
dc.date.accessioned2023-10-31T14:06:31Z
dc.date.accessioned2025-11-07T11:38:54Z
dc.date.available2023-10-31T14:06:31Z
dc.date.issued2020
dc.description.abstractAujourd’hui, le World Wide Web se veut l’une des plates-formes les plus sollicitées pour la diffusion et la recherche d’information. De ce fait, de nombreux chercheurs le considèrent comme la meilleure source d'information, sur laquelle ils s’appuient pour leurs fouilles des données. Il convient toutefois de souligner que le choix et la sélection des données sources sont cruciaux, dans la mesure où ils impactent directement le résultat final. En nous basant sur des études théoriques sur la fouille de texte, nous avons essayé d’élaborer un modèle sur lequel le chercheur pourrait se baser pour concevoir ses projets de fouille de contenu du web, et pour faciliter le choix et sélection des données sources selon ses objectifs de recherche. Par ailleurs, compte tenu du fait que la fouille de contenu web se distingue de la fouille texte uniquement par ses méthodes de collecte des données, nous avons développé des méthodes dédiées à la collecte automatique et à l’extraction intelligente des données, notamment le projet RCrawler développé avec le langage R. En dépit des difficultés et des limites relatives à ce processus, les expérimentations réalisées ont témoigné de la performance et l’efficacité des approches proposées.
dc.description.collaboratorSaid SAFI
dc.description.collaboratorYoussef ES-SAADY
dc.description.collaboratorRachid EL AYACHI
dc.description.collaboratorMohamed BASLAM
dc.identifier.urihttps://toubkalpreprod.imist.ma/handle/123456789/25616
dc.language.isoFR
dc.publisherFaculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat Nationalfr_FR
dc.subjectfouille de contenu du Webfr_FR
dc.subjectfouille de textefr_FR
dc.subjectanalyse de textefr_FR
dc.subjectcollection des donnéesfr_FR
dc.subjectrobot d’indexationfr_FR
dc.subjectextraction des donnéesfr_FR
dc.subject.other1. Natural Sciences
dc.subject.specific1.2 Computer and information sciences
dc.titleContribution au Développement d’Approches pour la Collecte et l’Extraction de contenue Web.fr_FR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
292-20 Salim KHALIL.pdf
Size:
2.69 MB
Format:
Adobe Portable Document Format