نام پژوهشگر: سمیه برومندی کلهرودی
سمیه برومندی کلهرودی رویا امجدی فرد
در سال های اخیر با رشد محتواهای الکترونیکی تولید شده توسط کاربر در فضای وب، منبع غنی از اطلاعات و نظرات در اختیار شرکت ها قرار داده شده است. با گسترش منابع داده یکی از چالش های شرکت های بزرگ، استخراج اطلاعات به صورت خودکار از این داده ها است. بنابراین نظرکاوی برمبنای ویژگی ها وخلاصه سازی آنها به یکی از مسائل مهم تبدیل شده است. هدف ما در این پژوهش استخراج ویژگی های محصول و نظرات بیان شده در زمینه ی آنها به صورت خودکار می باشد. در این پژوهش استخراج ویژگی های محصول و صفات نظر به عنوان یک فرایند همزمان انجام می گیرد. برخلاف کارهای انجام شده ی پیشین در یک فرایند پیش پردازش، ابتدا ضمایر موجود در متن شفاف سازی می گردند. استخراج ویژگی ها و صفات نظر به صورت یک مساله ی برچسب زنی دنباله در نظر گرفته شده است. و ازحوزه های تصادفی شرطی برای استخراج آنها استفاده می گردد. پس از استخراج ویژگی های محصول و صفات نظر، با استفاده از هستان شناسی ویژگی هایی که یکسان می باشند، در یک خوشه قرار می گیرند. در مرحله ی آخر نیز جهت گیری صفات نظر مشخص می گردد. به دلیل عدم وجود یک فرهنگ لغت جامع مانند wordnet در زبان فارسی و همچنین دشواری یافتن ادات سخن و مرجع ضمایر برای زبان فارسی، روش پیشنهادی بر روی متون انگلیسی مورد بررسی قرار گرفته است.