Conception et mise en œuvre de méta-moteurs de recherche dédiées

DSpace/Manakin Repository

Aide Aide Aide

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

Conception et mise en œuvre de méta-moteurs de recherche dédiées

Show full item record


Title: Conception et mise en œuvre de méta-moteurs de recherche dédiées
Author: El Ouerkhaoui, Asmâa
Abstract: Le présent travail de thèse a été consacré au domaine de la recherche et de l’extraction de données à partir Web. Le Web-mining (fouille de donnée à partir du Web) est une technologie qui permet de mettre en œuvre des moteurs de recherche verticaux permettant aux utilisateurs d'accéder à travers la même interface aux résultats de plusieurs sources de données préconfigurées (moteurs de recherche, annuaires, catalogues en ligne, etc...). Grâce au paramétrage de cet environnement et à une technologie sémantique unique, nous pouvons adapter les robots d'indexation du web à tous types de sources web par une configuration simplifiée et rapide. Les données ainsi collectées sur un nombre quelconque de sites web sont alors combinées et indexées sous forme d'entrepôt de données (Data warehouse). Pour ce faire, il a fallu opter pour le format standard XML pour les pages Web collectées. Contrairement au langage HTML, XML permet à des programmes informatiques de parser les documents web. Ainsi, la pré-configuration des sources de données passe d'abords par une XML-isation de celles-ci. Nous avons proposé une approche d’extraction inductifs (WIEBMat : Wrapper Induction EnvironementBased on Matrices) qui se base sur les instances exemples et sur les technologies XML notamment XHTML/XML et XSLT. Dans le cas des méthodes utilisant des instances exemples, l'objectif est de construire un ensemble de motifs pouvant s'appliquer à toute page Web d'une source de données Web. http://www.Compiu.com est l’implémentation de WIEBMat, cet outil se distingue des travaux existants sur plusieurs points : La généricité : WIEBMat peut être dédiés à toutes sortes de domaine de recherche notamment le e-commerce.
Date: 2013-06-15

Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account