نام پژوهشگر: امیر حاجی شعبانی
امیر حاجی شعبانی محمدرضا کرمی
حس بینایی درگاه ورود اطلاعات فراوان و در نتیجه افزایش کارایی سیستم می باشد. یکی از علومی که در راستای افزایش کارایی حس بینایی در سیستم های هوشمند به کار گرفته می شود، علم ماشین بینایی است. کشف و استخراج متن در تصویر یکی از مسائل بسیار مهم در زمینه ماشین بینایی می باشد. یکی از علوم مهمی که باعث افزایش درک مفهوم تصاویر متن دار برای سیستم می شود، استخراج متن آن است. بطور کلی متن، وزن زیادی از مفهوم تصویر را به همراه دارد، که با استخراج و تشخیص آن سیستم می تواند تصمیم گیری بهتری، در راستای رسیدن به هدف مورد نظر داشته باشد. جملات متن در یک تصویر می تواند از نظر فونت، اندازه، جهت و رنگ متفاوت باشند. همچنین در پس زمینه متن می توان اشیاء مختلف با رنگ های متفاوت وجود داشته باشند که باعث پیچیدگی پس زمینه گردند. در این تحقیق الگوریتم هایی ارائه شده است که می تواند مکان متن را در تصاویری با پیچیدگی زیاد مشخص کند. تصاویر مورد استفاده در این پژوهش از نوع تصاویر ثابت (عکس) هستند. یکی از پارامترهایی که اطلاعات خوبی از تصویر را نگه می دارد، لبه ها هستند که با انجام عملیات لبه گیری، می توان بیشتر مشخصه های متنی را در تصویر را کشف و با درصد اطمینان بالایی مکان متن را تشخیص داد. در این تحقیق تکنیک های مختلف استخراج متن از تصویر مبتنی بر ویژگی های مکانی و فرکانسی مورد بررسی قرار گرفته است. سپس روش پیشنهادی که بر مبنای ویژگی های مکانی متن طراحی شده است به صورت دو قسمت الگوریتم اولیه و نهایی ارائه شده است. الگوریتم اولیه شامل سه مرحله پیش پردازش، تشخیص لبه و حذف لبه های نا مطلوب می باشد. در مرحله پیش پردازش به کمک فیلتر wiener و ماسک unsharp ، تصویر ورودی نرم و لبه های آن برجسته می شود. پس از این مرحله، با استفاده از روش sobel ، به تشخیص لبه های متن می پردازد. این لبه ها را می توان به دو دسته لبه متنی (مطلوب) و لبه غیرمتنی (نا مطلوب) گروه بندی کرد که در قسمت حذف لبه های نا مطلوب به جداسازی این دو گروه پرداخته می شود. مرحله آخر شامل به کارگیری ابزارهای مورفولوژی و چندین شرط، که بر اساس ویژگی های مکانی متن و یک سری قوانین از پیش تعیین شده طراحی شده اند، می شود. این الگوریتم دارای بدنه ای ساده است که بر روی تصاویری با پیچیدگی کمتر دارای عملکرد مطلوبی می باشد. الگوریتم نهایی که ساختار جدیدی دارد، به صورت محلی بر روی تصویر اعمال می شود. در این روش لبه های تصویر را به این صورت تعریف می کنیم که تصویر مجموعه ای از لبه های منظم متن و لبه های غیر منظم غیرمتنی می باشد. بر اساس این تعریف، لبه هایی از تصویر که از نظر اندازه و فاصله مشابه می باشند در یک گروه(گروه کاندید متن) قرار گرفته و پردازش بر روی این گروه اعمال می شود. با استفاده از این ایده می توان لبه های منظم را از بین لبه های غیرمنظم تصویر پیدا کرد. برای پیاده سازی این الگوریتم، پس از حذف یک سری از لبه های نامطلوب، بقیه لبه ها براساس معیارهای اندازه و فاصله ناحیه بندی می شوند. آنگاه هر ناحیه بصورت محلی و مستقل از دیگر نواحی پردازش می گردند. در انتها نیز نواحی باقیمانده وارد بلوک جداساز نهایی می شوند. این بلوک شامل سه روش برای جداسازی بهتر نواحی متنی از غیرمتنی می باشد که شامل دو روش اصلی تئوری فازی و شبکه آستانه گذاری به همراه یک روش کمکی wavelet می شود. در نهایت آن قسمت هایی از تصویر که دارای مشخصات و نظم با خواص متنی بیشتری باشند باقی می مانند. روش مطرح شده بر روی چندین تصویر استاندارد اعمال شده و توسط معیارهای نرخ دقت و نرخ فراخوانی مورد ارزیابی قرار گرفته است. نتایج بدست آمده حاکی از بهبودی قابل ملاحظه روش ارائه شده نسبت به روش های موجود می باشد.