détection du plagiat sémentique multilingue pour les documents arabes

Toubkal : Le Catalogue National des Thèses et Mémoires

détection du plagiat sémentique multilingue pour les documents arabes

dc.contributor.advisor	Mohamed Oukessou
dc.contributor.author	EZZIKOURI HANANE
dc.description.collaborator	Mohamed Oukessou
dc.description.collaborator	Mohamed Erritali
dc.description.collaborator	Said Melliani
dc.description.collaborator	Bouabid El ouahidi
dc.description.collaborator	Mohamed Fakir
dc.description.collaborator	Najlae Idrissi
dc.description.collaborator	Rachid Elayachi
dc.date.accessioned	2023-10-31T14:06:06Z
dc.date.available	2023-10-31T14:06:06Z
dc.date.issued	2019
dc.identifier.uri	http://toubkal.imist.ma/handle/123456789/25524
dc.description.abstract	Le plagiat multilingue fait référence à la réutilisation non reconnue d'un texte impliquant sa traduction d'une langue naturelle à une autre, sans référence appropriée à la source d'origine. L'un des problèmes courants du traitement des données réside dans l'efficacité de la comparaison de textes volumineux. Dans un cas d'une similarité sémantique floue, la complexité des langages naturels (en particulier l'Arabe), et le nombre croissant de publications, contribuent à l’augmentation du taux de documents suspects sources de plagiat. CLP (Cross-Language Plagiarism) est un processus plus compliqué que le plagiat monolingue. CLP est plus qu'une copie munie d'une traduction, c’est un changement sérieux du texte traduit sans indication de la source. Par conséquent, le processus de détection révèle le besoin des analyses et des techniques compliquées pour découvrir des pratiques malhonnêtes de plagiat caché dans des documents arabes traduits de sources anglaises ou françaises. Dans cette thèse, nous proposons un système de détection de plagiat multilingue sémantique. D’abord on a construit un système de détection du plagiat multilingue CLPD (Cross-Language Plagiarism Detection) basé sur la similarité sémantique en utilisant WordNet. Puis, pour une analyse plus profonde des cas de plagiat multilingue, le système a été étendu en une similarité sémantique basée sur la théorie des ensembles flous. Ensuite, le travail est parallélisé en utilisant Apache Hadoop avec le système de fichiers HDFS et le modèle de programmation MapReduce, pour gérer les grandes masses d'informations et le nombre important d'opérations et des calculs faites dans un tel système.
dc.language.iso	Fr
dc.publisher	Faculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat National	fr_FR
dc.subject	Plagiat multilingue	fr_FR
dc.subject	théorie des ensembles floues	fr_FR
dc.subject	traitement du langage naturel	fr_FR
dc.subject	Arabe	fr_FR
dc.subject	similarité sémantique.	fr_FR
dc.subject.other	2. Engineering and Technology
dc.title	détection du plagiat sémentique multilingue pour les documents arabes	fr_FR
dc.subject.specific	1.2 Computer and information sciences

Files in this item

Files	Size	Format	View
201-19 EZZIKOURI HANANE.pdf	2.502Mb	PDF	View/Open or Preview

This item appears in the following Collection(s)

Faculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat National [472]

Show simple item record

détection du plagiat sémentique multilingue pour les documents arabes

DSpace/Manakin Repository

Nos fils RSS

Toubkal : Le Catalogue National des Thèses et Mémoires

détection du plagiat sémentique multilingue pour les documents arabes

Files in this item

This item appears in the following Collection(s)

Search DSpace

Browse

All of DSpace

This Collection

My Account