نام پژوهشگر: معصومه حسام
معصومه حسام مسعود گراوانچی زاده
تاکنون انواع مختلفی از تکنیک های بهبود گفتار مورد مطالعه قرار گرفته اند. از آنجایی که نویزهای متنوعی در محیط وجود دارند، هیچ یک از تکنیک های بهبود گفتار برای حذف همه انواع نویز مناسب نیستند. علاوه بر نویز پس زمینه در محیط، وجود سیگنال های تداخلی صحبت و همچنین انعکاس-های محیط، مسئله بهبود گفتار را پیچیده تر می کند و لزوم الگوریتم های حذف پژواک و تفکیک منابع را برای این منظور فراهم می آورد. اخیراً جداسازی کور منبع برای مخلوط های کانولوتیو در حوزه فرکانس به عنوان روشی برای تفکیک منابع صوتی معرفی شده است. در این روش از یکی از الگوریتم های ica همچون infomax به طور جداگانه در هر فرکانس، برای جداسازی مولفه های فرکانسی منابع استفاده می شود. الگوریتم infomax با اندازه گام ثابت از نظر همگرایی و پایداری دارای معایبی است. اگر اندازه گام کوچک انتخاب شود، سرعت همگرایی کاهش می یابد و اگر بزرگ انتخاب شود، ممکن است باعث ناپایداری الگوریتم شود. در بخشی از این پایان نامه روشی بر پایه تکنیک pso برای تعیین اندازه گام مناسب در الگوریتم infomax پیشنهاد می کنیم که موجب همگرایی بیشتر الگوریتم می شود. از سویی پس از جداسازی مولفه های فرکانسی منابع در هر فرکانس، برای بازسازی صحیح سیگنال ها از روی مولفه های فرکانسی در حوزه زمان باید مولفه های فرکانسی مربوط به هر یک از منابع دسته بندی شوند. این مسئله، جایگشت در حوزه فرکانس نام دارد و روش های متعددی برای حل آن وجود دارد. در بخش دیگری از این پایان نامه روشی برای حل مسئله جایگشت با استفاده از همبستگی نسبت توان (power ratio) مولفه های فرکانسی در حالت overdetermind، یعنی وقتی که تعداد میکروفون ها بیشتر از تعداد منابع باشد، پیشنهاد می شود.