نام پژوهشگر: مرتضی جادریان
مرتضی جادریان بیتا شادگار
در سال های اخیر، تکنیک های فیلتر محتوایی دانش محور مبتنی بر پایگاه دانش و آنتولوژی به روش هایی کارا و قابل قبول برای فیلتر اطلاعات تبدیل شده اند. در این تحقیق از ساختار آنتولوژی و پایگاه دانش های ویکی پدیا، وردنت و bnc برای عمل فیلتر اسناد، بهبود نمایش اولویت های کاربری و محتوای اسناد و محاسبه شباهت معنایی استفاده می شود. همچنین سامان دهی علایق کاربری و محتوای اسناد در پروفایل ها امکان استخراج دانش درباره ی علایق احتمالی کاربران و محتوای اسناد را با استفاده از آنتولوژی و پایگاه دانش فراهم می آورد. این تحقیق روشی نوین و منحصر به فرد در ساختار ترکیب خبرگان برای فیلتر اسناد ارائه می کند و مجموعه ای از بهترین و کاراترین روش های فیلتر را پیاده سازی و با هم یکپارچه می کند. ارزیابی سیستم در دو مرحله ارزیابی روش های محاسبه شباهت معنایی و روش های فیلتر محتوایی با استفاده از مجموعه داده های میلر- چارلز و 20newsgroup انجام می شود. نتایج ارزیابی، همبستگی زیاد روش های محاسبه ی شباهت معنایی میان مفاهیم را با قضاوت بشر نشان می دهد. روش مبتنی بر ویکی پدیا با میزان همبستگی 0.779 نه تنها از دیگر روش های پیاده سازی شده بهتر عمل می کند بلکه از روش های مشابه و شناخته شده ای مانند codc با میزان همبستگی 0.693 و روش esa با میزان همبستگی 0.58 بهتر عمل می کند. به علاوه در ارزیابی روش های فیلتر دانش محور ملاحظه می شود که روش مبتنی بر آنتولوژی با نرخ صحت و کارآیی 98.9 و 98 درصد و روش مبتنی بر ویکی پدیا با نرخ صحت و کارآیی 98.2 و 96 درصد نتایج بهتری نسبت به دیگر روش های مشابه و شناخته شده مانند nb-svm hybrid دارند. همچنین نتایج ارزیابی روش مبتنی بر ساختار ترکیب خبرگان با نرخ صحت و کارآیی 99.4 و 98.9 درصد نشان می دهد که این روش نه تنها از تک تک روش های پیاده سازی شده کارآیی و صحت بالاتری دارد، بلکه می تواند خطاهای عمل فیلتر را تصحیح کند. براساس این نتایج، سیستم پیاده سازی شده می تواند به عنوان رویکرد جدیدی در فیلتر محتوایی و به عنوان چارچوبی برای استفاده در کاربردهای فیلتر اطلاعات استفاده شود