نام پژوهشگر: محمد خدادادی آزادبنی
محمد خدادادی آزادبنی علیرضا بهراد
استخراج متن در تصاویر حاوی متن کاربردهای زیادی همچون تشخیص پلاک اتومبیل، علائم جاده، بایگانی اسناد و... دارد. هدف ما در این پایان نامه حذف نمودن متن از تصویر و بازسازی تصویر اولیه است بطوریکه محل متن در تصویر احساس نشود. بدین منظور ابتدا محل های متن شناسایی می شوند بعد بطور دقیق تر محل کاراکترها یا اجزای متصل متنی مشخص می شوند. در روش های ترمیم، سعی می شود تا آنجا که ممکن است از نواحی سالم تصویر، الگوبرداری مناسبی برای پر کردن نواحی آسیب دیده داشته باشد. بیشتر روشهای ترمیم تصویر از الگوی معینی استفاده می کنند و عمده تفاوتشان، ابتکار در نحوه نمونه گیری از نواحی سالم تصویر و انتقال به ناحیه آسیب دیده است. در این پایان نامه دو روش متفاوت برای استخراج ناحیه های متنی و یک روش ترمیم مبتنی بر ساختار و بافت پیشنهادی برای بازسازی آنها پیشنهاد شده است. از آنجاییکه بایستی ناحیه های متنی را در تصاویر ویدئویی حذف و تصویر را بازسازی کنیم، هدفمان کمینه کردن خطای الگوریتم و بالا بردن سرعت پردازش می باشد. اولین روش آشکارسازی و استخراج بر پایه اصول اولیه ویژگی متن بنا شده است در حالیکه در دومین روش، از ویژگی های بیشتر و ماشین یادگیر کمک گرفته شده است و همچنین دقت و سرعت را بهبود داده ایم. در واقع در روش اول، مکان یابی متن به کمک ویژگی نظم و پیوستگی در متن و اعمال الگوریتم افکنش انجام می گیرد. برای استخراج دقیق متن، با فرض تک رنگ بودن متن در زیرنویس تصویر، ابتدا رنگ پس زمینه را از کناره مرزی بلوک متن حدس می زنیم و سپس از رنگهای بلوک متن آن رنگی که فاصله بیشتری از رنگ پس زمینه دارد و تعداد اعضایش بیشتر است به عنوان رنگ متن انتخاب می شود. حال با اعمال حدآستانه مناسب پیکسلهایی که در شعاع همسایگی آن رنگ قرار دارند محل متن را نشان می دهند و در نهایت برای حذف نویز و افزایش دقت، عناصر کوچک را حذف می کنیم. در روش دوم برای مکان یابی متن، برای تعیین کاندیدهای اولیه بلوک متن، علاوه بر در نظر گرفتن این ویژگی ها از ویژگی گوشه و کنتراست در محل متن نیز استفاده می کنیم. در نهایت ویژگی هایی همچون زاویه، واریانس و کشیدگی افکنش، همبستگی متقابل و آنتروپی بر ماتریس هم وقوعی و... را از بلوک های یافت شده استخراج می کنیم و به کمک ماشین یادگیر بلوک متن از بلوک غیر متن تمیز می شود. همچنین برای استخراج محل متن در بلوک متن از طبقه بندی kmeans برای یافتن رنگ متن کمک می گیریم. بر خلاف روش اول روش دوم در یک مرحله بر هر سه کانال رنگ اعمال می شود، بنابراین سرعت و دقت در روش دوم بهبود می یابد.