نام پژوهشگر: امین پروانه

بهبود سرعت شناسایی گوینده در سیستم های با تعداد گوینده بالا با استفاده از خوشه بندی سلسله مراتبی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده صنایع 1390
  امین پروانه   رضا بشیرزاده

شناسایی هویت مطمئن یک اصل اساسی برای شروع یک تراکنش تجاری می باشد. استفاده از بیومتریک ها می تواند باعث بالارفتن امنیت، سرعت و سادگی سیستم های شناسایی هویت شود. صدا به عنوان یک بیومتریک با دقت نسبتا بالا، سادگی استفاده و پیاده سازی بالا، هزینه کم و پذیرش بالای کاربر، یک گزینه مناسب برای این منظور می باشد که تا کنون به شکل گسترده ای مورد استفاده قرار گرفته است. یکی از مشکلات سیستم های شناسایی گوینده معمول، سرعت کم این سیستم ها در زمان شناسایی می باشد که با افزایش تعداد گوینده ها به صورت خطی کاهش می یابد. علت این امر این است که در این سیستم ها یک مقایسه ی 1:n بین گوینده ی ناشناس و گویندگان ثبت شده در سیستم صورت می پذیرد. استفاده از خوشه بندی برای قرار دادن گوینده های شبیه به هم در یک خوشه و چند مرحله ای شدن شناسایی (ابتدا شناسایی نزدیکترین خوشه در یک یا چند مرحله و سپس شناسایی نزدیکترین گوینده قرار گرفته در آن خوشه) یکی از مهمترین کارهایی است که در این زمینه صورت گرفته است. در این تحقیق یک سیستم شناسایی گوینده طراحی شده است و نتایج آن در حالت معمول با کارهای مشابه تطابق داده شده است. پس از آن برای بهبود سرعت سیستم از روش خوشه بندی سلسله مراتبی تجمعی پایین به بالا به شکلی جدید استفاده شده است. در این روش برای ساختن یک گوینده مجازی به عنوان نماینده یک خوشه، از داده های همه ی گویندگان عضو آن استفاده می شود. 5 الگوریتم متفاوت بر اساس روش خوشه بندی پیشنهادی طراحی و مورد استفاده قرار گرفته اند. تفاوت اصلی این الگوریتم ها در نحوه محاسبه ی فاصله ی بین دو خوشه و نیز در نحوه ی ایجاد ساختار سلسله مراتبی (نحوه ی انتخاب خوشه ها برای ترکیب) می-باشد. نتایج این تحقیق، با توجه به طراحی در شرایط مشابه، با نتایج الگوریتم k-means، که از کاراترین الگوریتم های مورد استفاده در این زمینه تاکنون به شمار می رود، مقایسه شده است که نشان دهنده ی بهبود دقت در سرعت یکسان می باشد.