نام پژوهشگر: زهرا بهمنی کوخدان
زهرا بهمنی کوخدان رضا عزمی
با افزایش کتابخانه های دیجیتال و برای برای دستیابی به هدف ادارات بدون کاغذ تعداد زیادی از کپی ها به دیجیتال تبدیل شده و در سیستم مدیریت اسناد ذخیره شده است. همچنین در حال حاضر میلیون ها سند دیجیتال دائماً بر روی اینترنت از یک نقطه به نقطه ی دیگر منتقل می شوند. اگر چه تکنولوژی پردازش تصویر اسناد می تواند برای تبدیل اتوماتیک تصاویر دیجیتال این اسناد به فرمت متن قابل خواندن به وسیله کامپیوتر با استفاده از بازشناسی کارکتر نوری استفاده شود ولی این روش برای حجم عظیمی از اسناد بهینه و کارا نیست. با توجه به این شرایط یافتن راه حل بازیابی اسناد پرینت شده به روشی که نیاز به برگرداندن این اسناد به نسخه ی متنی نداشته باشد ضروری به نظر می آید. روش های بازیابی و بازشناسی به دو دسته اصلی تقسیم می شوند. دسته اول بازیابی را بر اساس توصیف شکل کلی کلمات یا زیرکلمات انجام می دهند. دسته دوم کلمه را به حروف می شکنند و از هر تصویر حرف ویژگی استخراج می کنند. در روشهای مبتنی بر جداسازی علاوه بر مشکلاتی مانند وجود نقاط و علائم و تنوع قلمها، مشکل جداسازی حروف نیز وجود دارد. در این پژوهش ما از روشی برای استخراج ویژگی های کلمات استفاده کرده ایم که نیاز به تخمین نقاط جداسازی ندارد. برای این منظور از شناسایی اتصال دهنده های عناصر اصلی حروف استفاده شده است. با شناسایی این اتصال دهنده ها و حذف آنها عناصر اصلی که در این پژوهش با نام زیرحروف نامگذاری شده اند استخراج شده است. در این پژوهش از سه روش زیر برای تشخیص زیرحروف استفاده شده است. در روش اول زیرحروف با استفاده از درخت تصمیم و به کمک ویژگی های شکلی زیرحروف مانند ارتفاع، عرض، حفره ها، گودال ها، دره ها، فرورفتگی ها و موقعیت عنصر نسبت به خط زیمینه تشخیص داده شده اند. دقت تشخیص در این روش برای زیرحروف بین 80 نا 100 در صد بوده است. در روش دوم از ترکیبی از درخت تصمیم نخ کشی شده و شبکه عصبی rbf برای تشخیص زیرحروف استفاده شده است. در این روش علاوه بر ویژگی های شکلی کلمه، ویژگی نمایه ها در چهار جهت بکار برده شده است. نتایج روش دوم برای زیرحروف بین 90 تا 100 ارزیابی شده است. سومین روش مورد استفاده شبکه عصبی چند سطحی می باشد. در این روش تشخیص تنها به وسیله ویژگی نمایه ها و در سه تا چهار سطح و با استفاده از شبکه عصبی انجام شده است. تشخیص در این روش برای اغلب زیرحرف ها بالای 95 درصد بوده است. در نهایت با کد کردن زیرحروف، زیرکلمات و کلمات موجود در تصویر سند کد شده و برای بازیابی کلمات کلیدی مورد نظر کاربر استفاده شده است. دقت سیستم برای کلمات با طول متغییر به طور متوسط بالای 90 درصد ارزیابی شده است.