نام پژوهشگر: احمد عباسی مزرعه خطیری
احمد عباسی مزرعه خطیری صمد مومن بالله
چکیده رده بندی اسناد وب فارسی که اشاره به سازماندهی اتوماتیک اسناد وب و کلاسه کردن آن ها مطابق با مفاهیمشان دارد، از دیدگاه بازیابی اطلاعات و دانش اهمیت ویژه ای دارد. در این اثر تحقیقی اشاره به سه موضوع در رده بندی اسناد وب با استفاده از تئوری فازی دارد که به وسیله ایده های منحصربه فردی ارائه شده است. این ایده ها شامل انتخاب ویژگی ترکیبی و درصدی، استفاده از شبه گنجینه فازی و استفاده از یک رابطه فازی جهت رده بندی اسناد وب است. در شبه گنجینه فازی مطرح شده ویژگی های استخراج شده از اسناد، پس از بهینه سازی به وسیله الگوریتم های رایج، توسط عامل های نرم افزاری و به صورت نیمه اتوماتیک به مقادیر فازی تبدیل و در یک پایگاه داده با فرمت cds ذخیره می شود. این پایگاه داده مورد استفاده رابطه فازی قرار می گیرد تا به وسیله آن اسناد را به صورت فازی مورد تحلیل قرار دهد. نتایج حاصل از این تحقیق، که با استفاده از یک مجموعه داده جمع آوری شده از درگاه وکی پدیا و همشهری آن لاین انجام شده است و تعیین حجم آن مبتنی بر یک روش تجربی و آماری است که در تحقیقات قبل انجام گرفته است. نتایج حاصل از این تحقیق نشان می دهد که روش مورد استفاده برای رده بندی اسناد وب فارسی مطلوب است به گونه ای که دقت تقریبی 80 درصد را در خروجی دارد که مقدار بسیار مطلوبی است. کلید واژه : تئوری فازی، تابع عضویت، رده بندی، فضای بردار.
احمد عباسی مزرعه خطیری صمد مومن بالله
رده بندی اسناد وب فارسی که اشاره به سازماندهی اتوماتیک اسناد وب و کلاسه کردن آن ها مطابق با مفاهیمشان دارد، از دیدگاه بازیابی اطلاعات و دانش اهمیت ویژه ای دارد. در این اثر تحقیقی اشاره به سه موضوع در رده بندی اسناد وب با استفاده از تئوری فازی دارد که به وسیله ایده های منحصربه فردی ارائه شده است. این ایده ها شامل انتخاب ویژگی ترکیبی و درصدی، استفاده از شبه گنجینه فازی و استفاده از یک رابطه فازی جهت رده بندی اسناد وب است. در شبه گنجینه فازی مطرح شده ویژگی های استخراج شده از اسناد، پس از بهینه سازی به وسیله الگوریتم های رایج، توسط عامل های نرم افزاری و به صورت نیمه اتوماتیک به مقادیر فازی تبدیل و در یک پایگاه داده با فرمت cds ذخیره می شود. این پایگاه داده مورد استفاده رابطه فازی قرار می گیرد تا به وسیله آن اسناد را به صورت فازی مورد تحلیل قرار دهد. نتایج حاصل از این تحقیق، که با استفاده از یک مجموعه داده جمع آوری شده از درگاه وکی پدیا و همشهری آن لاین انجام شده است و تعیین حجم آن مبتنی بر یک روش تجربی و آماری است که در تحقیقات قبل انجام گرفته است. نتایج حاصل از این تحقیق نشان می دهد که روش مورد استفاده برای رده بندی اسناد وب فارسی مطلوب است به گونه ای که دقت تقریبی 80 درصد را در خروجی دارد که مقدار بسیار مطلوبی است.