Reconnaissance de l'écriture arabe multifonte à très basse résolution

نویسندگان

  • Oussama Zayene
  • Fouad Slimane
چکیده

RÉSUMÉ. Nous proposons dans ce travail une approche de reconnaissance de textes arabes imprimés hors-ligne à vocabulaire ouvert et à très basse résolution (72 dpi). La méthode est basée sur les Modèles de Markov Cachés en utilisant la boite à outils HTK. La nouveauté de QRWUH WUDYDLO HVW GDQV O¶DQDO\VH GH FH W\SH GH V\VWqPHV VXU Wrois fontes de calligraphie complexe et présentant de fortes ligatures : DiwaniLetter, DecoTypeNaskh et DecoTypeThuluth. Nous proposons une extraction de caractéristiques basée sur O¶Xsage de primitives statistiques et structurelles permettant une description robuste des différentes variabilités morphologiques des fontes considérées. Le système proposé est évalué sur la base APTI (Arabic Printed Text Image). ABSTRACT. We propose in this work an approach for automatic recognition of printed Arabic text in open vocabulary mode and ultra low resolution (72 dpi). This system is based on Hidden Markov Models using the HTK toolkit. The novelty of our work is in the analysis of three complex fonts presenting strong ligatures: DiwaniLetter, DecoTypeNaskh and DecoTypeThuluth. We propose a feature extraction based on statistical and structural primitives allowing a robust description of the different morphological variability of considered fonts. The validation of the proposed approach was operated on the APTI database (Arabic Printed Text Image). MOTS-CLÉS: OCR arabe, reconnaissance, MMC, très basse résolution, multi-fontes.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

La Théorie de la Résonance Adaptative et les Moments de Zernike pour la Reconnaissance de Mots Arabes Manuscrits

Résumé. La reconnaissance de l'écriture arabe manuscrite est un domaine de recherche relativement récent et qui a connu ces dernières années des progrès remarquables. Il présente un intérêt indéniable dans l’accomplissement de tâches considérées fastidieuses dans certains domaines comme le tri postal, la lecture de chèques bancaires, la lecture des bordereaux, etc. Ce papier présente la concept...

متن کامل

Exploitation de l'échelle d'écriture pour améliorer la reconnaissance automatique des textes manuscrits arabe

RÉSUMÉ. Les documents manuscrits arabes présentent des défis spécifiques pour la reconnaissance du fait de la nature de l'écriture cursive et d'autres facteurs, comme la taille de l'écriture. Une des plus grandes bases étiquetées des documents manuscrits arabes, la base de données NIST­OpenHaRT inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons ...

متن کامل

Système Neuro-Markovien pour la Reconnaissance de l'Écriture Manuscrite Arabe à Vocabulaire Limité

Résumé. Nous proposons une manière de coopérer des MMC et des réseaux neuronaux dans une architecture probabiliste en tirant avantage des deux outils : la génération d’une liste des N meilleures hypothèses de mots ainsi que leurs segmentations en caractères par un classifieur MMC et les propriétés de modélisation des réseaux neuronaux appliquées aux caractères. Le classifieur RN utilise la segm...

متن کامل

ARABASE : base de données Web pour l'exploitation en reconnaissance optique de l'écriture arabe

Nous proposons dans ce travail ARABASE une base de données d’images d’échantillons d’écriture arabe pour l’exploitation en reconnaissance optique de l’écriture (OCR-Optical Character Recognition). Cette base est implémentée sur un réseau à longue distance. L’étude des particularités morphologiques de l’écriture arabe, dans sa forme imprimée et manuscrite (en ligne et hors ligne), et les différe...

متن کامل

Potentialités des nouveaux capteurs à très haute résolution spatiale pour l'extraction des réseaux de rues urbains

RÉSUMÉ. La disponibilité d’images satellites à très haute résolution spatiale au dessus de zones urbaines est récente. Elle constitue potentiellement un très grand apport pour la cartographie des villes à des échelles de l’ordre du 1 :10 000. La très haute résolution spatiale de ces nouveaux capteurs permet une représentation réelle des rues sur une carte, mais engendre une augmentation signifi...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012