نام پژوهشگر: ساقی السادات ضرغامی فر
ساقی السادات ضرغامی فر عفت گلپر رابوکی
اندیشه کاوی به دسته بندی متن ها بر اساس تمایل مندرج در آن ها می پردازد و به عنوان زیر رشته ای جدید از پردازش زبان طبیعی، بازیابی اطلاعات و متن کاوی محسوب می شود. دانستن عقاید افراد در یک حوزه خاص نقش مهمی در تصمیم گیری های آن حوزه ایفا می کند. بنابراین فناوری اندیشه کاوی برای کاربردهای علمی، قلمرو وسیعی دارد. اندیشه کاوی در سه سطح قابل بررسی می باشد. اندیشه کاوی در سطح سند، در سطح جمله و در سطح ویژگی. در این پژوهش، به دلیل کاربردی بودن اندیشه کاوی در سطح ویژگی، دو روش برای این منظور ارائه شده است. روش اول یک روش نیمه ناظر خود راه انداز به منظور استخراج ویژگی ها و گسترش لغت نامه اندیشه کاوی بوده و روش دوم استخراج ویژگی ها مبتنی بر تکرار است. روش های پیشنهادی شامل چهار گام اصلی است. در گام نخست لغت نامه اندیشه کاوی برای زبان فارسی ایجاد می شود. گام دوم مرحله پیش پردازش شامل یکسان سازی نگارشی، تقطیع، ایجاد برچسب های ادات سخن و برچسب وابستگی نحوی اسناد است. گام سوم استخراج ویژگی ها با استفاده از دو روش پیشنهادی است و در گام چهارم ویژگی های به دست آمده در مرحله قبلی اصلاح شده و در نهایت قطبیت ویژگی ها تعیین می گردد. برای ارزیابی روش های پیشنهادی، مجموعه عقاید کاربران در دو حوزه دانشگاه و تلفن همراه جمع آوری شده و نتایج حاصل از دو روش با یکدیگر مقایسه می شوند.