détection du plagiat sémentique multilingue pour les documents arabes

dc.contributor.advisorMohamed Oukessou
dc.contributor.authorEZZIKOURI HANANE
dc.date.accessioned2023-10-31T14:06:06Z
dc.date.accessioned2025-11-07T11:38:40Z
dc.date.available2023-10-31T14:06:06Z
dc.date.issued2019
dc.description.abstractLe plagiat multilingue fait référence à la réutilisation non reconnue d'un texte impliquant sa traduction d'une langue naturelle à une autre, sans référence appropriée à la source d'origine. L'un des problèmes courants du traitement des données réside dans l'efficacité de la comparaison de textes volumineux. Dans un cas d'une similarité sémantique floue, la complexité des langages naturels (en particulier l'Arabe), et le nombre croissant de publications, contribuent à l’augmentation du taux de documents suspects sources de plagiat. CLP (Cross-Language Plagiarism) est un processus plus compliqué que le plagiat monolingue. CLP est plus qu'une copie munie d'une traduction, c’est un changement sérieux du texte traduit sans indication de la source. Par conséquent, le processus de détection révèle le besoin des analyses et des techniques compliquées pour découvrir des pratiques malhonnêtes de plagiat caché dans des documents arabes traduits de sources anglaises ou françaises. Dans cette thèse, nous proposons un système de détection de plagiat multilingue sémantique. D’abord on a construit un système de détection du plagiat multilingue CLPD (Cross-Language Plagiarism Detection) basé sur la similarité sémantique en utilisant WordNet. Puis, pour une analyse plus profonde des cas de plagiat multilingue, le système a été étendu en une similarité sémantique basée sur la théorie des ensembles flous. Ensuite, le travail est parallélisé en utilisant Apache Hadoop avec le système de fichiers HDFS et le modèle de programmation MapReduce, pour gérer les grandes masses d'informations et le nombre important d'opérations et des calculs faites dans un tel système.
dc.description.collaboratorMohamed Oukessou
dc.description.collaboratorMohamed Erritali
dc.description.collaboratorSaid Melliani
dc.description.collaboratorBouabid El ouahidi
dc.description.collaboratorMohamed Fakir
dc.description.collaboratorNajlae Idrissi
dc.description.collaboratorRachid Elayachi
dc.identifier.urihttps://toubkal.imist.ma/handle/123456789/25524
dc.identifier.urihttps://doi.org/10.83129/toubkal-3794
dc.language.isoFr
dc.publisherFaculté des Sciences et des Techniques, Béni Mellal - Doctorat ou Doctorat Nationalfr_FR
dc.subjectPlagiat multilinguefr_FR
dc.subjectthéorie des ensembles flouesfr_FR
dc.subjecttraitement du langage naturelfr_FR
dc.subjectArabefr_FR
dc.subjectsimilarité sémantique.fr_FR
dc.subject.other2. Engineering and Technology
dc.subject.specific1.2 Computer and information sciences
dc.titledétection du plagiat sémentique multilingue pour les documents arabesfr_FR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
201-19 EZZIKOURI HANANE.pdf
Size:
2.39 MB
Format:
Adobe Portable Document Format