Evaluation of a possibilistic classification approach for Arabic texts disambiguation (Evaluation d'une approche de classification possibiliste pour la désambiguïsation des textes arabes) [in French]

نویسندگان

  • Raja Ayed
  • Ibrahim Bounhas
  • Bilel Elayeb
  • Narjès Bellamine Ben Saoud
  • Fabrice Evrard
چکیده

Morphological disambiguation of Arabic words consists in identifying their appropriate morphological analysis. In this paper, we present three models of morphological disambiguation of non-vocalized Arabic texts based on possibilistic classification. This approach deals with imprecise training and testing datasets, as we learn from untagged texts. We experiment our approach on two corpora i.e. the Hadith corpus and the Arabic Treebank. These corpora contain data of different types: traditional and modern. We compare our models to probabilistic and statistical classifiers. To do this, we transform the structure of the training and the test sets to deal with imprecise data. Mots-clés : Traitement Automatique des Langues Naturelles, Désambiguïsation Morphologique de l’Arabe, Théorie des Possibilités, Classification Possibiliste.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Smoothing methods for a morpho-statistical approach of automatic diacritization Arabic texts (Méthodes de lissage d'une approche morpho-statistique pour la voyellation automatique des textes arabes) [in French]

We present in this work a new approach for the Automatic diacritization for Arabic texts using three stages. During the first phase, we integrated a lexical database containing the most frequent words of Arabic with morphological analysis by Alkhalil Morpho Sys which provided possible diacritization for each word. The objective of the second module is to eliminate the ambiguity using a statisti...

متن کامل

Un système de vote pour la classification de textes d'opinion

La classification de textes a pour objectif le regroupement de documents selon différents critères. Dans les travaux présentés dans cet article, nous nous intéressons à la classification de textes d'opinion qui consiste à classer les textes selon un jugement tel que l'aspect positif ou négatif d'une critique, l'aspect favorable ou défavorable donné par un expert, etc. Nous proposons dans cet ar...

متن کامل

Clustering par Fusion Floue de Données Appliqué à la Segmentation d'Images IRM Cérébrales

Résumé. Dans cet article nous proposons une approche originale basée sur les techniques de data mining pour l’extraction des connaissances par fusion floue de données. Cette approche présente une nouvelle architecture de fusion de données basée sur la théorie possibiliste pour la segmentation d’une cible à partir de plusieurs sources d’images. Le processus de fusion est décomposé en trois phase...

متن کامل

Utilisation des ressources externes pour la reformulation des requêtes dans un système de recherche d'information

Dans un Système de Recherche d’Information (SRI), les démarches pour la reformulation de la requête sont nombreuses. Elles peuvent être classées selon les ressources utilisées en trois grandes approches : l’utilisation des ressources externes, l’analyse globale et l’analyse locale. Dans ce contexte et dans le cadre des SRI pour les textes Arabes, nous nous intéressons à l’évaluation des perform...

متن کامل

Exploitation de l'échelle d'écriture pour améliorer la reconnaissance automatique des textes manuscrits arabe

RÉSUMÉ. Les documents manuscrits arabes présentent des défis spécifiques pour la reconnaissance du fait de la nature de l'écriture cursive et d'autres facteurs, comme la taille de l'écriture. Une des plus grandes bases étiquetées des documents manuscrits arabes, la base de données NIST­OpenHaRT inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014