زهرا حاجی حسنی

نام پژوهشگر: زهرا حاجی حسنی

بازشناسی عبارات ریاضی با استفاده از شبکه اتصالات مجازی کاراکترها جهت افزایش نرخ بازشناسی در متون چاپی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1387
زهرا حاجی حسنی محمد رحمتی

بازشناسی عبارات ریاضی یکی از مسایل مهم در تبدیل اسناد علمی و مهندسی به قالب الکترونیکی می باشد و به عبارت دیگر هدف از تحقیقات در این زمینه، تبدیل تصویر یک عبارت ریاضی به معادل متنی آن می باشد. این مسأله به طور کلی شامل سه بخش اصلی می باشد: 1- استخراج عبارات ریاضی از اسناد 2- شناسایی نمادهای موجود در عبارت. 3- بررسی ساختاری عبارت و تبدیل به شکل متنی. در این پایان نامه به هر یک از مراحل فوق در بازشناسی عبارات ریاضی چاپی پرداخته شده است. به این ترتیب که ابتدا با دریافت تصویر یک سند چاپی شامل عبارات ریاضی و متن عادی، عبارات ریاضی از آن استخراج می شوند. در این پایان نامه استخراج عبارات ریاضی که جدا از متن اصلی هستند، مورد نظر است. در این مرحله، از روش استخراج بلوک ها و سپس بازشناسی نوع بلوک ها با استفاده از ویژگی های محلی و سراسری بلوک ها استفاده شده است. در مرحله ی بازشناسی نماد از یک روش ترکیبی مبتنی بر دسته بندی سلسله مراتبی و تطابق الگو استفاده شده است. در مرحله ی بازشناسی ساختار از یک روش جدید مبتنی بر گراف برای بازشناسی عبارات ریاضی تک خطی استفاده شده است. در این روش ابتدا نماد آغازین عبارت و سپس نمادهای تشکیل دهنده ی خط اصلی، در عبارت شناسایی می شوند. سپس با توجه به موقعیت های مکانی نمادها، شبکه ای تشکیل می گردد که، گراف اتصالات مجازی نمادها نامیده شده است. خروجی مرحله ی بازشناسی ساختار عبارت tex معادل عبارت ریاضی است که در قالب متن ارایه می شود. پس پردازش هایی نیز برای مقابله با خطاها و افزایش نرخ بازشناسی ارایه شده است. روش های فوق بر روی یک مجموعه ی شامل 86 صفحه از تصاویر اسناد که از مجلات ieee استخراج شدند مورد آزمایش قرار گرفتند. نرخ بازشناسی برای مرحله ی استخراج عبارات %90 حاصل گردید. از بین عبارات استخراج شده یک مجموعه ی 300تایی انتخاب شده و دو مرحله ی بازشناسی نماد و بازشناسی ساختار بر روی آنها مورد آزمایش قرار گرفت و نرخ بازشناسی، برای مرحله ی بازشناسی نمادها % 87/91 و برای مرحله ی بازشناسی ساختار %48/97 حاصل گردید. پس از اعمال روش های مقابله با خطا برای یک مجموعه ی 100 تایی از عبارات، نرخ بازشناسی مرحله ی بازشناسی نماد از %33/91 به %63/94، و نرخ بازشناسی مرحله ی بازشناسی ساختار از %63/97 به %44/98 افزایش یافت.

۱۵ صفحه ی اول