نام پژوهشگر: علیرضا احمدیفرد
مریم سبزواری علیرضا احمدی فرد
استخراج متن موجود در تصاویر صحنه های طبیعی، امروزه مورد توجه محققین زیادی قرارگرفته است. محتوای صحنه می تواند به دو طبقه مهم تقسیم بندی شود. محتوای ادراکی و محتوای معنایی. محتوای ادراکی شامل خصوصیات رنگ، شکل و بافت صحنه می باشد. در مقابل محتوای معنایی شامل متن، چهره، رفتارها و حرکات انسان است. در میان اطلاعات مختلف موجود در صحنه، اطلاعات متنی از اهمیت ویژ ه ای برخوردارند، چرا که به آسانی توسط انسان قابل فهم بوده و امکان توصیف محتوای یک صحنه را فراهم می کنند. در این پایان نامه، روشی برای استخراج متن از صحنه ها با پس زمینه پیچیده، بدون در نظر گرفتن زبان نوشتاری ارایه شده است. الگوریتم پیشنهادی از چهار مرحله اصلی تشکیل می شود. در مرحله اول به کمک ویژگی تغییر گرادیان در لبه های صحنه اقدام به استخراج نواحی کاندید متن می نماییم. در مرحله بعد از میان کاندیدها با توجه به این واقعیت که اجزاء تشکیل دهنده یک سطر متن در صحنه دارای راستا و ارتفاع تقریبا یکسانی هستند به گروه بندی نواحی استخراج شده می-پردازیم. در مرحله سوم از ویژگی های هیستوگرام اندازه گرادیان و زاویه گرادیان در نواحی استخراج شده، استفاده نموده تا نواحی غیر متنی را فیلتر نماییم. برای این منظور از یک طبقه بند ماشین بردار پشتیبان که توسط ویژگی های هیستوگرام اندازه گرادیان و زاویه گرادیان نواحی متنی و غیر متنی آموزش دیده است استفاده می کنیم. در ادامه با قرار دادن معیار فاصله بر مبنای عرض نواحی متنی یافت شده و استفاده از افکنش افقی نتیجه بهبود داده می شود. نتایج ارزیابی روش پیشنهادی بر روی صحنه ها ،دارای متون فارسی و انگلیسی با قلم های مختلف با پس زمینه های ساده و پیچیده متون می باشند که بر اساس تشخیص و ارزیابی نتایج حاصل از سه مجموعه داده icdar 2003/2005 dataset ، microsoft street view text detection dataset و مجموعه داده فارسی, روش تشخیص متن پیشنهاد شده می تواند برای متن با قلم ها، اندازه، رنگ و جهت گیری های مختلف کار آمد باشد. این نتیجه در مقایسه با روش های موجود بسیار امیدوار کننده است.
محمدعلی اکبریان ترک آباد حسین خسروی
خودکارسازی فرایند تشخیص عیوب محصولات در کارخانه ها، اقدام مهمی در جهت بهبود کیفیت، کاهش نیروی انسانی و ارتقاء رضایت مشتریان است. در کارخانه های تولید کاشی، یک عیب اساسی که گاهی با چشم هم به خوبی شناسایی نمی شود، مشکل لایه ای شدن کاشی است که به سبب باقیماندن هوا در لایه های داخلی کاشی به وجود می آید. این مشکل هر چه سریع تر در خط تولید شناسایی شود، هزینه های کمتری را در بر خواهد داشت. در این پایان¬نامه، با استفاده از امواج فراصوت، روشی هوشمند به منظور تشخیص عیب لایه¬ای قبل از پخت کامل کاشی، ارائه شده است. در ابتدا با استفاده از مولد امواج فراصوت و حس گر دریافت کننده امواج، یک مجموعه 546 تایی از سیگنال های فراصوت عبوری از کاشی های سالم و معیوب تهیه شد. سپس با استفاده از تبدیل فوریه سریع و بسته موجک، ویژگی¬های مناسبی را از نمونه سیگنال¬ها استخراج کرده و برای آموزش به طبقه¬بندهای مختلف داده شد. برای یافتن طبقه¬بند مناسب از چندین طبقه¬بند به طور همزمان استفاده شد تا علاوه بر مقایسه عملکرد هرکدام بتوان در صورت نیاز از ترکیب طبقه¬بندها برای افزایش دقت بازشناسی استفاده کرد. طبقه¬بندهای استفاده شده شامل: mlp، k-nn، lvq، beysian و svm است که با داشتن تفاوت در روش، از دقت خوبی برخوردارند. در انتها نیز از روش انتگرال سوگنو برای ترکیب نتایج طبقه¬بندها استفاده شده که نتایج بازشناسی را تا 100 درصد افزایش داده است.
علیرضا فخری نوش آبادی علیرضا احمدی فرد
در این تحقیق روشی برای تشخیص دستنوشته برخط فارسی بر مبنای شناسایی حروف سازنده زیرکلمات ارائه شده است. ورودی سیستم های تشخیص دستنوشته برخط مجموعه ای از نقاط در صفحه مربوط به دستنوشته است که عموماً توسط وسایل دیجیتال نظیر تبلت ها و تلفن های همراه هوشمند و به طور هم زمان با عمل نوشتن جمع آوری می شوند و به همین دلیل به آن برخط گویند. در روش پیشنهادی در یک گام ساده سازی داده ورودی به صورت مجموعه ای از خطوط افقی و عمودی با دو بردار جهت و اندازه خطوط که در واقع ویژگی های استخراجی از داده هستند بازنمایی می شود. سپس برای تشکیل پایگاه دانش سیستم از بدنه حروف الفبا در مکان های مختلف زیرکلمه از بردارهای ویژگی الگوهای مرجع استخراج می شوند. در گام شناسایی، لیستی از زیرکلمات با شناسایی حروف سازنده نمونه ورودی بوسیله انطباق الگو با استفاده از یک الگوریتم پیشنهادی با تکنیک برنامه نویسی پویا پیشنهاد می شود و درنهایت در گام پس پردازش پیشنهاداتی که در فرهنگ لغت سیستم وجود نداشته باشند و یا از لحاظ تعداد و مکان قرارگیری علامت ها با داده ورودی همخوانی نداشته باشند توسط دو فیلتر حذف می شوند. درصد تشخیص حروف جدای فارسی با استفاده از ساده سازی و الگوریتم پیشنهادی محاسبه فاصله اصلاح برابر 2/95 % شده است و درصد بازشناسی برای تشخیص زیرکلمات فارسی برای سه گزینه اول پیشنهادی برابر 29/63% بدست آمد. هرچند درصد تشخیص بدست آمده نسبت به روشهای کلی نگر پایین تر است ولی مزیت روش پیشنهادی در شناسایی حروف سازنده زیرکلمه نسبت به روش های کلی نگر در آن است که برای بازشناسی زیرکلمات جدید تنها کافی است که متن این زیرکلمات به فرهنگ لغت سیستم اضافه شوند، درحالی که در روش های کلی نگر نیاز به نمونه های جدید از دستنوشته است.
سعید طالقانی علیرضا احمدی فرد
شناسایی خودکار و صحیح پلاک خودرو از طریق پردازش تصویر حاوی پلاک، یکی از اهداف مهم و ارزش مند سیستم های حمل و نقل هوشمند می باشد. بدین منظور روش های مختلفی در مقالات معتبر علمی ارائه شده است که بسیاری از آن ها دارای عیوبی از قبیل حجم محاسبات بالا و حساسیت نسبت به عواملی چون توزیع روشنایی متغیر و غیر یکنواخت در تصویر پلاک، رنگ پلاک و به دست آمدن تصویر غیر دقیقی از پلاک در مرحله اول، می باشند. در این پایان نامه هدف ما شناسایی پلاک خودرو در تصاویر با شدت روشنایی نا مناسب می باشد. الگوریتم پیشنهادی شامل دو بخش اصلی پردازش تصویر و الگوریتم وراثتی است. به منظور مقاوم شدن سیستم در مقابل تغییرات شدت روشنایی در محیط تصویر برداری شده از استانه گزاری تطبیقی در دودویی کردن تصویر استفاده شده است. در این سامانه از ماتریس شبه لاپلاسی با پنجره ابتکاری در راستای بهبود کنتراست تصویر و وضوح مرز های تصویر که باعث می شود پس زمینه و شناسه در تصویر پلاک از یکدیگر متمایز شود، استفاده شده است . در ادامه آنالیز اجزای متصل به منظور تشخیص اشیا در تصویر به سیستم اعمال شده و در انتها الگوریتم وراثتی با استفاده از ماتریس روابط هندسی بین شناسه-های پلاک، محل پلاک را شناسایی و شناسه های آن را تقطیع میکند. بسیاری از مشکلات تشخیص و جداسازی پلاک از قبیل شکستن شناسه ها یا به هم چسبیدن شناسه ها با استفاده از الگوریتم وراثتی کاهش می یابد چون این الگوریتم تا رسیدن به مقدار شایستگی قابل قبول اجرا میشود. در سیستم پیشنهادی با ارائه دو عملگر همبری بر اساس مرتب کردن ِژن ها، سرعت و بازده الگوریتم ژنتیک افزایش می یابد. به منظور ارزیابی، روش پیشنهادی را بر روی پایگاه داده شامل 500 تصویر متفاوت از نظر روشنایی، فاصله، پس زمینه آزمایش نموده ایم. متوسط نرخ تشخیص صحیح را 98 %، به دست آوردیم.
نوشین نبی زاده اردکانی علی سلیمانی ایوری
یکی از مهمترین راه های ارتباطی انسان از طریق چهره و حالات آن است. حالات چهره در انتقال منظور و ارتقاء کیفیت ارتباطات انسانی نقشی اساسی بازی می کند. در دنیای صنعتی امروز تشخیص خودکار احساسات چهره در طیف وسیعی از زمینه ها از قبیل مطالعات روان شناسی و حقوقی، انیمیشن سازی، روباتیک، لب خوانی، درک تصاویر و ویدئو کنفرانس ها، مخابرات و ارتباطات تلفنی، تشخیص موارد مشکوک در محافظت های امنیتی و ضد تروریستی، شناسایی افراد و هم چنین تقابل انسان و ماشین کاربرد دارد. دانشمندان از سی سال گذشته تا کنون فعالیت های زیادی در این زمینه انجام داده اند و موفقیت های چشمگیری در رشد و توسعه این سیستم ها به دست آورده اند، به طوری که چه در زمینه ی تشخیص حالات هفت گانه در تصاویر ویدئویی و زنده و چه در زمینه ی بررسی تصاویر استاتیک و ضبط شده به سیستم هایی با بازده ی بالای 80% رسیده اند. تمامی این سیستم ها مبتنی بر سه بخش انتخاب ویژگی، استخراج ویژگی و کلاسه بندی آن ها هستند و از یک نقطه نظر، روش ها ی استخراج ویژگی به دو دسته ی روش های هالستیک و روش های آنالیتیک تقسیم بندی می شوند. از جنبه ی دیگر این روش ها در سه گروه روش های تصویر پایه، مدل پایه و ویژگی پایه قابل تفکیک اند. در این پایان نامه پس از بررسی های بسیار این نکته آشکار شد که عموم روشهای موجود یا دارای پیچیدگی های محاسباتی بالا و یا راندمان پایین هسستند و بزرگترین مشکل در این گونه مسائل ایجاد مصالحه ای بین این دو عامل است. لذا به دنبال الگوریتم های موجود چندین پیشنهاد برای تکمیل و بهینه کردن آنها ارائه شد و نهایتا الگوریتمی با نرخ تشخیص 99% در تشخیص احساسات شادی و غم به دست آمد. در ابتدا برای استخراج نقاط اصلی چهره از الگوریتم بهبود یافته ی لوپیاس استفاده شد. استخراج ویژگی به کمک آنالیز مولفه های اساسی و تلفیق آن با فیلترهای گابر صورت گرفت و برای کلاس بندی روش های معیار فاصله، شبکه عصبی و تلفیق آن با شبکه آماری به کار رفت. بازده 99% حاصل پیاده سازی فیلترهای گابر و آنالیز مولفه های اساسی روی چشم و دهان استخراج شده از طریق الگوریتم نقاط برجسته ی لوپیاس و کلاس بندی به کمک شبکه عصبی پرسپترون است. روش پیشنهادی شبکه آماری زمینه ی بازی را برای بررسی بیشتر در کارهای آینده ارائه می دهد.