نام پژوهشگر: هادی نادری
هادی نادری حسین مروی
تشخیص کلمات کلیدی یا keyword-spotting در حالت کلی به معنای یافتن یک کلمهی کلیدی در یک پروندهی نوشتاری و یا گفتاری است. در این تحقیق، یک روش جدید تشخیص یا بازشناسی کلمات کلیدی در زبان فارسی، در دوحالت پیوسته و گسسته معرفی شده است. در هر دوحالت تشخیص کلمات کلیدی در گفتار پیوسته و گسسته، از روش dynamic time warping(dtw) استفاده شده است که با سیستمهایی که بر اساس مدل مخفی مارکوف طراحی شده و امروزه به طور گسترده از آنها استفاده میشود، متفاوت هستند. روش ارائه شده برای تشخیص کلمات کلیدی در حالت پیوسته، بر پایهی حالت اصلاح شدهای از روش قدیمی dynamic time warping است، که یک روش ابتدایی برای محاسبهی میزان شباهت دو دنبالهی متغیر با زمان است. در مرحلهی پردازش، سیگنال گفتار به فریمهایی با طول کم تقسیم میشود. هر فریم به صورت یک بردار کوانتیزه شده از ویژگیها نمایش داده میشود. هم کلمهی کلیدی و هم گفتار اصلی که جستجو در آن انجام میشود، به صورت دنبالهای یک بعدی از اندیسهای کتاب کد تبدیل میشوند. سپس دنبالهی اندیسهای گفتار اصلی به چندین جزء تقسیم شده و فاصلهی هرکدام از این بخشها طبق معیار dtw با اندیسهای کلمهی کلیدی بدست میآید. برای هر بخش یک امتیاز اعوجاج محاسبه میشود و بخشی که کمترین امتیاز اعوجاج را داشته باشد، به عنوان محل احتمالی حضور کلمهی کلیدی معرفی میشود. در روش ارائه شده برای تشخیص کلمات کلیدی در حالت گسسته نیز از روش dtw استفاده شده است. در این حالت، ابتدا از نمونههای مختلف از یک کلمهی کلیدی خاص که توسط یک یا چند گوینده بیان شدهاند و دارای طول متفاوت هستند، بردارهای ویژگی را استخراج کرده و سپس کلمهای که دارای کوچکترین طول است را به عنوان نمونهی مرجع انتخاب میکنیم. سپس با استفاده از روش dtw، مسیر همترازی نمونهی مرجع و سایر نمونهها را بدست آورده و از روی مسیر همترازی، ابعاد ماتریس ویژگی سایر نمونهها را هم بعد با نمونهی مرجع میسازیم. در نهایت از ماتریس ویژگی تمام نمونهها، میانگین میگیریم تا یک نمونهی مرجع عام برای هر کلمهی کلیدی بدست آید. در ادامه از این نمونهی مرجع عام در فرایند تشخیص استفاده میکنیم.