نام پژوهشگر: بابک ناصر شریف

طراحی سیستم تشخیص اسکناس با استفاده از شبکه های عصبی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه گیلان - دانشکده فنی و مهندسی 1389
  حبییب آهکی لاکه   حمید ضابط

مبادله اسکناس یکی از مهمترین روش ها در داد و ستد می باشد. با توجه به اهمیت موضوع و جایگاه مبادلات پولی در زندگی روزمره تجهیزات فراوانی مانند ماشین های فروش، مرتب کنندهای اسکناس، دستگاههای خودپرداز و دستگاه تشخیص اسکناس برای نابینایان ساخته شده و روز به روز گسترده تر و با قابلیت بیشتر عرضه می گردند. که بالطبع نیاز به روش های تشخیص اسکناس کارآمد تر، سریعتر، دقیقتر و جامع تری دارند. با توجه به اینکه اسکناس بعنوان یک سند با ارزش و بها دار می باشد و اشتباه در تشخیص باعث زیانهای مالی جـبران ناپذیر شده، دقت و صحت تشخیص اسکناس از اهمیت فراوان بر خوردار می باشد. در اغلب روشهای تشخیص اسکناس، یکی از مشخصه های تصویر مانند رنگ غالب، طیف ماوراء بنفش و علی الخصوص اطلاعات بافت تصویر استخراج می شود و فرآیند تشخیص بر اساس آن انجام می شود. ما در این پایان نامه سعی کردیم روشی برای تشخیص اسکناس معرفی نماییم که اطلاعات بافت و اطلاعات رنگ در آن ترکیب شده و به عنوان یک واحد اطلاعات به شبکه عصبی اعمال گردد. تصاویر اسکناس ها و بالطبع اطلاعات استخراجی از بافت و رنگ تصویر معمولاً بعلت نویزهای تصویری مطابقت صد درصد با اسکناس اصلی نداشته و مغایرت هایی با آن دارد. حـال در اکثر موارد نویزها تاثیر اصـلی خـود را بیشتر بر روی یکی از این مشخصه های تصویر گـذاشته و دیگری کمتر مخدوش می شود، که این امر یک عامل موثر در تشخیص صحیح تر در این روش می باشد.

استفاده از ویژگی های پی در پی برای بهبود نرخ بازشناسی گفتار و آزمون روش روی یک پایگاه داده محدود فارسی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده مهندسی برق و کامپیوتر 1392
  حمیدرضا ارومیه   بابک ناصر شریف

در بازشناسی گفتار ویژگیهای مختلفی مورد استفاده قرار گرفته اند که موفقترین آنها ضرایب مل کپستروم هستند. این ویژگیها در شرایط نویزی معمولا عملکرد مطلوبی ندارند و تمایز کافی را نیز میان واحدهای بازشناسی گفتاری فراهم نمی کنند. از این رو تحقیقات متعددی درباره افزایش کارآیی ویژگیها در شرایط نویزی و همینطور تمیز صورت گرفته است. یکی از این روشها استفاده از ویژگیهای پی در پی است. در این روش به صورت کلاسیک ابتدا ویژگیهای متداول گفتاری برای آموزش یک شبکه عصبی پرسپترون چند لایه بکار می روند که سبب افزایش متمایز سازی ویژگیها می شود و سپس خروجیهای شبکه عصبی که از جنس احتمال پسین هستند به عنوان ویژگی در اختیار یک سیستم بازشناسی گفتار مبتنی بر مدل مخفی مارکف قرار می گیرد. در پایان نامه حاضر، دو روش برای اصلاح روند استخراج ویژگی پی در پی پیشنهاد شده است. در روش اول، با توجه به اینکه شبکه عصبی احتمالاتی و شبکه عصبی تابع شعاعی پایه را می توان به عنوان یک تبدیل متمایز ساز غیر خطی در نظر گرفت، پیشنهاد شده است که به جای شبکه عصبی کلاسیک پرسپترون در روند استخراج ویژگی پی در پی، از دو شبکه عصبی مذکور استفاده شود. در روش دوم، با هدف غلبه بر ضعف الگوریتم انتشار به عقب در یادگیری پرسپترون چندلایه و همچنین یادگیری بهتر روابط میان ویژگیها و تخمین بهتر احتمالات، از شبکه باور عمیق به جای شبکه عصبی پرسپترون چندلایه برای استخراج ویژگیهای پی در پی استفاده شده است. نتایج بازشناسی بر روی دادگان گفتاریaurora2 و نیز یک دادگان مشتمل بر کلمات مجزای فارسی نشان می دهد که بکار گیری شبکه های عصبی تابع شعاعی پایه و نیز شبکه عصبی احتمالاتی در استخراج ویژگیهای پی در پی بهتر از پرسپترون چند لایه عمل می کنند. به علاوه، نتایج حاکی از آن هستند که بکارگیری شبکه باور عمیق در استخراج ویژگیهای پی در پی نسبت به شبکه های عصبی مذکور سبب بهبود قابل توجه نرخ بازشناسی گفتار می شود.