نام پژوهشگر: محمد یحیی اخلاقی

ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده علوم پایه مهندسی 1392
  محمد یحیی اخلاقی   محمد بحرانی

در این پایان نامه، یک پیش پردازش برای روشهای بازیابی اطلاعات، ارائه می شود، که برای بازیابی اطلاعات حاصل از متون بازشناسی شده ی گفتاری، مناسب است. ورودیهای مسئله اسناد متنی بدست آمده از بازشناسی گفتار و پرس و جو است. هدف یافتن اسناد مرتبط می باشد. مشکل این است که متن حاصل از بازشناسی گفتار، همواره دارای درصدی خطا در بازشناسی است که موجب می شود، بازیابی به خوبی عمل نکرده و اسناد مرتبط تشخیص داده نشوند. ایده ی این روش، تشخیص خطای بازشناسی در کلمات و در نظر گرفتن کلمات مشابه برای آن دسته از کلماتی که به عنوان خطا تشخیص داده شده اند، می-باشد. برای تشخیص کلمه ی خطا، پارامتری به عنوان احتمال خطا در کلمه تعریف شد که بزرگ بودن آن بیانگر امکان بیشتر وقوع خطا در کلمه است. برای تشخیص کلمات مشابه، ابتدا کلماتی از واژگان را بر اساس فاصله ای به نام فاصله ی لونشتاین فیلتر می نماییم. سپس احتمال تبدیل را در کلمات باقی مانده محاسبه می کنیم. در نهایت، کلمات مشابه، از بین کلماتی که احتمال تبدیل بیشتری دارند، بر اساس یک سطح آستانه انتخاب می شود. نتایج پیاده سازی نشان دهنده ی بهبود قابل ملاحظه ای در روش های بازیابی، با در نظر گرفتن این پیش پردازش می باشد.