نام پژوهشگر: امیر فلاح تفتی

طراحی روش نگاشت تصویر به صوت به منظور تسهیل در مسیریابی نابینایان
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده برق و کامپیوتر 1393
  امیر فلاح تفتی   محمد تشنه لب

در این پایان نامه روشی جدید برای نگاشت تصویر به صوت ارائه خواهد شد. هدف از ارائه ی این روش تسهیل در مسیریابی نابینایان می باشد. این تسهیل با شناسایی موانع ایستای پیش روی نابینا و مطلع ساختن وی از طریق سیگنال های صوتی می باشد. از اصلی ترین نقاط ضعف روش های پیشین می توان به عدم پردازش تصویر، عدم اطلاع از فاصله ی موانع در صوت تولیدی، استفاده از روش صوتی سازی نامفهوم، نیاز به آموزش زیاد و تجهیزات سطح بالای مدل اشاره کرد. در روش پیشنهادی پس از اعمال پیش پردازش های مناسب، تصویر قطعه بندی می شود تا موانع موجود در صحنه استخراج شوند. به این منظور از آستانه گذاری چندسطحی با الگوریتم ژنتیک موازی استفاده می شود. سپس تصویر حاصل به صوت تبدیل می شود. نگاشت به صوت به گونه ای است که موقعیت و فاصله ی موانع از کاربر را مشخص می کند. روش پیشنهادی با انجام پردازش های مناسب بر روی تصویر، صوتی ساده و قابل فهم تولید می کند که درک آن نیاز به آموزش اندکی دارد و اطلاعات موقعیت و فاصله را نیز انتقال می دهد. در انتها روش قطعه بندی پیشنهادی با روش های مشابه مقایسه شده است. همچنین آزمایش هایی بر روی 5 داوطلب به منظور بررسی کارآیی صوت تولیدی صورت گرفته است. نتایج نشان می دهند که صوت تولیدی می تواند در فرآیند مسیریابی راهگشا باشد.