نام پژوهشگر: ساقی السادات ضرغامی فر

طراحی سامانه ی استخراج ویژگی ها در اندیشه کاوی مورد استفاده در متون فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی 1392
  ساقی السادات ضرغامی فر   عفت گلپر رابوکی

اندیشه کاوی به دسته بندی متن ها بر اساس تمایل مندرج در آن ها می پردازد و به عنوان زیر رشته ای جدید از پردازش زبان طبیعی، بازیابی اطلاعات و متن کاوی محسوب می شود. دانستن عقاید افراد در یک حوزه خاص نقش مهمی در تصمیم گیری های آن حوزه ایفا می کند. بنابراین فناوری اندیشه کاوی برای کاربردهای علمی، قلمرو وسیعی دارد. اندیشه کاوی در سه سطح قابل بررسی می باشد. اندیشه کاوی در سطح سند، در سطح جمله و در سطح ویژگی. در این پژوهش، به دلیل کاربردی بودن اندیشه کاوی در سطح ویژگی، دو روش برای این منظور ارائه شده است. روش اول یک روش نیمه ناظر خود راه انداز به منظور استخراج ویژگی ها و گسترش لغت نامه اندیشه کاوی بوده و روش دوم استخراج ویژگی ها مبتنی بر تکرار است. روش های پیشنهادی شامل چهار گام اصلی است. در گام نخست لغت نامه اندیشه کاوی برای زبان فارسی ایجاد می شود. گام دوم مرحله پیش پردازش شامل یکسان سازی نگارشی، تقطیع، ایجاد برچسب های ادات سخن و برچسب وابستگی نحوی اسناد است. گام سوم استخراج ویژگی ها با استفاده از دو روش پیشنهادی است و در گام چهارم ویژگی های به دست آمده در مرحله قبلی اصلاح شده و در نهایت قطبیت ویژگی ها تعیین می گردد. برای ارزیابی روش های پیشنهادی، مجموعه عقاید کاربران در دو حوزه دانشگاه و تلفن همراه جمع آوری شده و نتایج حاصل از دو روش با یکدیگر مقایسه می شوند.