نام پژوهشگر: راضیه خدیوی گلکارزاده

خوشه بندی زبان نوشتار در تصاویر اسناد چندخطه چاپی برای نرم افزارهای ocr
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه امام رضا علیه السلام - دانشکده مهندسی برق و کامپیوتر 1392
  راضیه خدیوی گلکارزاده   سعید شعرباف تبریزی

تشخیص حروف نوری یکی از حوزه های کاری در شناسایی الگو می باشد. همه ساله مقالات مرتبط با این موضوع در کنفرانس های حوزه هوش مصنوعی، شناسایی الگو، پردازش تصویر، ماشین بینایی و ... ارائه می شود. با این وجود به لحاظ گستردگی زبان ها در دنیا و پیچیدگی ذاتی این موضوع، هنوز علاقمندان بسیاری در پی یافتن نتایج بهتر برای شناسایی متون می باشند. اکثر مقالات با بیان این که هر زبان نوشتار ویژگی های خاص خود را دارا می باشد، فقط می توانند حروف سندی را شناسایی کنند که دارای یک زبان نوشتار است. در بررسی اسناد، موارد زیادی وجود دارد که سند دارای دو یا چند زبان متفاوت است. لذا سیستم های تشخیص متون نیاز به شناسایی چند زبان به صورت همزمان دارند. در این پژوهش با انتخاب چند زبان رسمی دنیا، الگوریتمی برای طبقه بندی زبان در یک سند چند زبانه پیشنهاد شده است. تفاوت کار طبقه بندی و شناسایی کامل هر زبان این است که سیستم نیازی ندارد وقت خود را صرف شناسایی کامل زبان نوشتار کند. سیستم شناسایی متون، فقط تشخیص میدهد هر قسمت از متن به کدام طبقه زبانی تعلق دارد و سپس کار استخراج ویژگیهای هوشمند متناسب با آن طبقه را انجام می دهد. هم چنین در سیستم پیشنهادی به دلیل عدم تشخیص دقیق خط، میزان خطا نیز کاهش پیدا میکند. الگوریتم پیشنهادی بر مبنای ویژگی های استخراج شده از ظاهر نوشتار، کار طبقه بندی را انجام می دهد. مدل های به کار رفته برای طبقه بندی، مدل ساده و سلسله مراتبی و طبقه بند مورد استفاده ساختار درخت تصمیم با سطوح آستانه وفقی است. درصد تشخیص به دست آمده بر روی متون اسکن شده 93.3% و برای داده های عکس برداری شده با دوربین 91% می باشد که اثر بخشی مدل ارائه شده را اثبات می کند.