Toubkal : Le Catalogue National des Thèses et Mémoires
Contribution au Développement d’Approches pour la Collecte et l’Extraction de contenue Web.
dc.contributor.advisor | Mohamed FAKIR | |
dc.contributor.author | JABIR BRAHIM | |
dc.description.collaborator | Said SAFI | |
dc.description.collaborator | Youssef ES-SAADY | |
dc.description.collaborator | Rachid EL AYACHI | |
dc.description.collaborator | Mohamed BASLAM | |
dc.date.accessioned | 2023-10-31T14:06:31Z | |
dc.date.available | 2023-10-31T14:06:31Z | |
dc.date.issued | 2020 | |
dc.identifier.uri | http://toubkal.imist.ma/handle/123456789/25616 | |
dc.description.abstract | Aujourd’hui, le World Wide Web se veut l’une des plates-formes les plus sollicitées pour la diffusion et la recherche d’information. De ce fait, de nombreux chercheurs le considèrent comme la meilleure source d'information, sur laquelle ils s’appuient pour leurs fouilles des données. Il convient toutefois de souligner que le choix et la sélection des données sources sont cruciaux, dans la mesure où ils impactent directement le résultat final. En nous basant sur des études théoriques sur la fouille de texte, nous avons essayé d’élaborer un modèle sur lequel le chercheur pourrait se baser pour concevoir ses projets de fouille de contenu du web, et pour faciliter le choix et sélection des données sources selon ses objectifs de recherche. Par ailleurs, compte tenu du fait que la fouille de contenu web se distingue de la fouille texte uniquement par ses méthodes de collecte des données, nous avons développé des méthodes dédiées à la collecte automatique et à l’extraction intelligente des données, notamment le projet RCrawler développé avec le langage R. En dépit des difficultés et des limites relatives à ce processus, les expérimentations réalisées ont témoigné de la performance et l’efficacité des approches proposées. | |
dc.language.iso | FR | |
dc.publisher | Faculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat National | fr_FR |
dc.subject | fouille de contenu du Web | fr_FR |
dc.subject | fouille de texte | fr_FR |
dc.subject | analyse de texte | fr_FR |
dc.subject | collection des données | fr_FR |
dc.subject | robot d’indexation | fr_FR |
dc.subject | extraction des données | fr_FR |
dc.subject.other | 1. Natural Sciences | |
dc.title | Contribution au Développement d’Approches pour la Collecte et l’Extraction de contenue Web. | fr_FR |
dc.subject.specific | 1.2 Computer and information sciences |
Files in this item
Files | Size | Format | View | |
---|---|---|---|---|
292-20 Salim KHALIL.pdf | 2.825Mb |
View/ |
||