استخراج اطلاعات در سیستم های پرسش و پاسخ، با استفاده از یک رویکرد آماری- ممتیکی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده برق و کامپیوتر
- نویسنده ایمان خدادی
- استاد راهنما محمد صنیعی آباده سعید جلیلی
- سال انتشار 1393
چکیده
سیستم¬های پرسش و پاسخ، موتورهای جستجویی هستند که توانایی¬ ارائه¬ی پاسخی یکتا، کوتاه و دقیق، به یک پرسش را دارند. به عبارتی دیگر، پرسشی که یک موتور جستجو، با مجموعه¬ای از سندها پاسخ می¬دهد، یک سیستم پرسش و پاسخ، با یک پاراگراف، جمله، کلمه و ...، پاسخ می¬دهد. در این پایا¬ن¬نامه، یک فراسیستم با دامنه¬ی باز و مبتنی بر وب، برای پاسخ¬گویی به پرسش¬های انگلیسی¬ تعریفی و حقایق، ارائه شده است. چارچوبی که برای این فرآیند طراحی شده است، شامل سه مرحله ارزیابی است. در مرحله¬ی اول، پاراگراف¬های متن¬های بازیابی شده توسط یک موتور جستجو، ارزیابی شده و امکان پاسخ¬گویی به یک پرسش تعریفی، فراهم می¬شود. برای پاسخ¬گویی به یک پرسش حقایق، باید دو مرحله ارزیابی دیگر نیز اعمال شود که شامل ارزیابی جملات پاراگراف¬های برتر ارزیابی قبلی و ارزیابی کلمات استخراج شده از جملات برتر، می¬شود. در مراحل ارزیابی پاراگراف و جمله، می¬بایست تمامی موارد را برای یافتن اعضای نزدیک به پرسش، بررسی کرد. اما اگر تعداد متن¬های بازیابی شده، زیاد باشند، بررسی تمام موارد زمان¬گیر خواهد شد. به همین دلیل، یک روش جستجوی تکاملی برای این فرآیند ارائه شده است که مبتنی بر الگوریتم ممتیک است. محدوده¬ی تعداد پاراگراف و جمله¬ای که الگوریتم ممتیک با آن آزمایش شده است، حدودا 1000 الی 2000 است. دقت به دست آمده برای پاسخ¬گویی به پرسش¬های تعریفی، برای مجموعه¬ای از 100 سوال تعریفی و داده¬های وب، با الگوریتم ممتیک برابر 76%، و بدون الگوریتم ممتیک، 81% بود. دقت پرسش¬های حقایق نیز، برای پرسش¬های trec qa track 2007 و داده¬های وب، با استفاده از الگوریتم ممتیک، برابر 0.55 و بدون الگوریتم ممتیک، 59% بود. این نتایج با مقالات مشابه و نتایج trec نیز مقایسه شده است. در راستای افزایش دقت در سه مرحله¬ی ارزیابی، روشی مبتنی بر الگوریتم برنامه¬نویسی ژنتیک، برای تولید ویژگی¬ جدید از ویژگی¬های موجود و عملگرهای ریاضی، ارائه شده است. در ارزیابی¬ها این نتیجه حاصل شده که ویژگی¬های ترکیبی ساخته شده، دقت بهتری نسبت به ویژگی¬هایی دارند که از آن¬ها تشکیل شده¬اند. ارزیابی پاراگراف¬ها، جملات و کلمات، نیازمند یافتن وزن ویژگی¬های آن¬ها است و برای این فرآیند، از سه روش¬ دسته¬بندی مبتنی بر تفکیک، استفاده شده است. به منظور استخراج اطلاعات از جملات برای پاسخ¬گویی به سوالات حقایق، مجموعه¬ای از عبارات منظم ارائه شده و جزئیات تطابق این الگوها با سوالات trec 2004 و trec 2007، بررسی شده است.
منابع مشابه
ارائه یک مدل احتمالاتی جهت تعیین انسجام متن در سیستم های پرسش و پاسخ تعاملی
Evaluation plays an important role in interactive question answering systems like many computational linguistics fields. The coherence between the questions and the answers exchanged between the user and the system is one of the important criteria in evaluating these systems. In this paper, a new approach to determine the degree of coherence of generated text by the IQA systems is presented. Th...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملبهبودی در سیستم های پیشنهادگر خبره با استفاده از بسط پرسش و مدل فضای برداری
Due to enormous volume of information available on the Web, finding appropriate knowledge in a short time seems difficult. Knowledge Recommender systems, Online Forums and Question Answering (QA) systems were created to facilitate finding suitable information. QA systems use knowledge repositories to retrieve brief responses to users’ queries. Expert Finding system, not only causes knowledge tr...
متن کاملارایه یک پیکره پرسش و پاسخ مذهبی در زبان فارسی
Question answering system is a field in natural language processing and information retrieval noticed by researchers in these decades. Due to a growing interest in this field of research, the need to have appropriate data sources is perceived. Most researches about developing question answering corpus area have been done in English so far, but in other languages as Persian, the lack of these co...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023