نام پژوهشگر: محبوبه ضیایی
محبوبه ضیایی علی اکبر نیک نفس
امروزه حجم قابل توجهی از اطلاعات موجود در قالب متن ذخیره شده اند؛ بنابراین استفاده از ابزار هایی که به استخراج دانش از میان این دریای عظیم داده های بپردازد اهمیت زیادی پیدا کرده است. ذات غیر ساخت یافته ی متون باعث شده که متنکاوی نیاز به مرحله ای مهم به نام پیش پردازش داشته باشد؛ هرچه پیش پردازش قوی تری داشته باشیم نتایج بهتری را در سایر مراحل خواهیم داشت. در این پایان نامه سعی شده به حل چالش ها و مسائل حوزه پیش پردازش و در نهایت طبقه بندی متون بپردازیم؛ از جمله دستاورد های این پایان نامه می توان به موارد زیر اشاره کرد:یک روش جدید وزن دهی ویژگی، مخصوص طبقه بندی مستندات ارائه شده است. مقایسه ی این روش با روش های وزن دهیtfidf، tfrf، tfcrf نشان دهنده ی کارایی خوب این روش نسبت به سایر روش ها می باشد. از روش ارائه شده برای ارائه یک روش حذف خودکار کلمات زائد متن، استفاده گردیده است؛ سپس تاثیر حذف کلمات زائد با استفاده از روش پیشنهادی و با استفاده از لیست از قبل تهیه شده را بر روی طبقه بندی مقایسه نموده ایم،که نتایج گویای بهبود کارطبقه بند در هنگام استفاده از روش پیشنهادی بوده است. با توجه به اهمیت وجود دیکشنری برای طبقات مستندات، الگوریتمی جدید برای استخراج دیکشنری ارائه و سپس ارزیابی شده است. در پایان الگوریتمی جدید برای طبقه بندی مستندات ارائه نموده ایم، که این الگوریتم را با روش های متفاوت وزن دهی مورد بررسی قرار دادیم. در ادامه با طبقه بندی تصادفی اولیه ی متفاوت نیز الگوریتم پیشنهادی را بررسی کردیم که تمامی نتایج به دست آمده گویای کارایی بالای این الگوریتم می باشد. همچنین در انتها نیز به ارزیابی عملکرد الگوریتم پیشنهادی نسبت به سایر الگوریتم ها پرداختیم، که الگوریتم پیشنهادی دارای بهترین کارایی در بین سایر الگوریتم ها بود.تمامی موارد ذکر شده را پیاده سازی و در قالب سیستمی نرم افزاری ارائه نموده ایم.
محبوبه ضیایی خدیجه رضوی
چکیده ندارد.