نام پژوهشگر: سید سعید صرفجو
سید سعید صرفجو روح الله دیانت
موضوع این پایاننامه بررسی مسأله بازیابی اطلاعات در متن حاصل از بازشناسی گفتار میباشد. یک ورودی مسأله، تعدادی سند متنی که از بازشناسی گفتار به دست آمدهاند میباشد. ورودی دوم نیز یک کوئری است. هدف این است که کوئری را در اسناد جستجو نموده و اسناد مرتبط را پیدا کنیم. مشکلی که در اینجا وجود دارد این است که متن حاصل از بازشناسی گفتار، همواره دارای درصد خطایی در بازشناسی است که موجب میشود کلمات دچار خطا شده، معادل با کوئری در نظر گرفته نشوند و در نتیجه سند، مرتبط تشخیص داده نشود. در این پایاننامه یک روش بازیابی اطلاعات مقاوم نسبت به خطای بازشناسی گفتار ارائه شده است. ایده کلی این است که برای هر کلمه مهم موجود در سند، تعدادی کلمه مشابه در نظر بگیریم. به این ترتیب به ازای هر سند، تعدادی سند جایگزین به دست میآید. با توجه به تعداد زیاد اسناد جایگزین، در مرحله بعد، موثرترین اسناد جایگزین انتخاب میگردند. این اسناد جایگزین به اسناد فعلی اضافه گردیده و در نهایت الگوریتم بازیابی روی مجموعه جدید اسناد اعمال میگردند. برای هر یک از مراحل یافتن کلمات مهم، یافتن کلمات مشابه و به دست آوردن موثرترین اسناد، الگوریتمهای کارایی پیشنهاد شده است. نتایج پیادهسازی، نشاندهنده کارایی مناسبتر روش ارائه شده نسبت به روشهای بازیابی اطلاعات معمولی است. به طور خلاصه میتوان گفت در این پایاننامه، پیشپردازشی ارائه شده است که انجام آن قبل از اعمال الگوریتم بازیابی اطلاعات، موجب کارایی مناسبتر آن در حوزه بازیابی متون حاصل از بازشناسی گفتار میشود.