Toubkal : Le Catalogue National des Thèses et Mémoires
Conception et mise en œuvre de méta-moteurs de recherche dédiées
dc.contributor.author | El Ouerkhaoui, Asmâa | |
dc.description.collaborator | Aboutajdine, Driss (Président et Directeur de la thèse) | |
dc.description.collaborator | Rziza, Mohammed (Examinateur) | |
dc.description.collaborator | El Hassouni, Mohammed (Examinateur) | |
dc.description.collaborator | Mouline, Salma (Examinateur) | |
dc.description.collaborator | El Qadi, Abderrahim (Examinateur) | |
dc.description.collaborator | Sdigui Doukkali, Abdelaziz (Examinateur) | |
dc.date.accessioned | 2021-04-01T14:48:04Z | |
dc.date.available | 2021-04-01T14:48:04Z | |
dc.date.issued | 2013-06-15 | |
dc.identifier.uri | http://toubkal.imist.ma/handle/123456789/13227 | |
dc.description.abstract | Le présent travail de thèse a été consacré au domaine de la recherche et de l’extraction de données à partir Web. Le Web-mining (fouille de donnée à partir du Web) est une technologie qui permet de mettre en œuvre des moteurs de recherche verticaux permettant aux utilisateurs d'accéder à travers la même interface aux résultats de plusieurs sources de données préconfigurées (moteurs de recherche, annuaires, catalogues en ligne, etc...). Grâce au paramétrage de cet environnement et à une technologie sémantique unique, nous pouvons adapter les robots d'indexation du web à tous types de sources web par une configuration simplifiée et rapide. Les données ainsi collectées sur un nombre quelconque de sites web sont alors combinées et indexées sous forme d'entrepôt de données (Data warehouse). Pour ce faire, il a fallu opter pour le format standard XML pour les pages Web collectées. Contrairement au langage HTML, XML permet à des programmes informatiques de parser les documents web. Ainsi, la pré-configuration des sources de données passe d'abords par une XML-isation de celles-ci. Nous avons proposé une approche d’extraction inductifs (WIEBMat : Wrapper Induction EnvironementBased on Matrices) qui se base sur les instances exemples et sur les technologies XML notamment XHTML/XML et XSLT. Dans le cas des méthodes utilisant des instances exemples, l'objectif est de construire un ensemble de motifs pouvant s'appliquer à toute page Web d'une source de données Web. http://www.Compiu.com est l’implémentation de WIEBMat, cet outil se distingue des travaux existants sur plusieurs points : La généricité : WIEBMat peut être dédiés à toutes sortes de domaine de recherche notamment le e-commerce. | |
dc.language.iso | fr | fr_FR |
dc.publisher | Université Mohammed V - Agdal, Faculté des Sciences, Rabat | |
dc.relation.ispartofseries | Th-004.678/OUE | |
dc.subject | Web mining | |
dc.subject | XML-isation | |
dc.subject | WIEBMatSciences de l'ingénieur | |
dc.subject | Informatique | |
dc.subject | Télécommunication | |
dc.subject | Web sémantique | |
dc.subject | Gestion de contenu | |
dc.title | Conception et mise en œuvre de méta-moteurs de recherche dédiées | fr_FR |
dc.description.laboratoire | Recherche en Informatique et Télécommunication, (LAB.) |
Files in this item
Files | Size | Format | View |
---|---|---|---|
There are no files associated with this item. |