نام پژوهشگر: خدیجه خشنواطاهر
خدیجه خشنواطاهر بهروز مینایی بیدگلی
امروزه حجم عظیمی از اطلاعات و دانش به صورت متنی و به فرم دیجیتال است. با توجه به روند رشد دانش، دسته بندی اسناد برای کاهش پیچیدگی اطلاعات و دسترسی آسان و سریع به آنها، امر بسیار مهمی است. در دنیای واقعی بسیاری از مسائل دسته بندی اسناد متنی، دارای ماهیت سلسله مراتبی هستند. در حال حاضر فرآیند دسته بندی اسناد به صورت دستی انجام می شود، و چون کار انسانی هم کند است و هم شامل خطا، این فرآیند زمان بر و پر هزینه است. اغلب مطالعات در زمینه ی متن کاوی و دسته بندی اسناد، روی مسائل دسته بندی مسطح تمرکز کرده اند. الگوریتم های دسته بندی مسطح، از یک طرف به دلیل عدم درنظر گرفتن روابط بین دسته ها و از طرف دیگر به دلیل تعداد زیاد دسته ها، در مواجهه با اینگونه مسائل کارآمدی لازم را نخواهند داشت. برای حل اینگونه مسائل از روش های دسته بندی سلسله مراتبی استفاده می شود. روش های مختلفی برای دسته بندی سلسله مراتبی اسناد متنی وجود دارد از جمله رویکرد سراسری و رویکرد محلی. در این تحقیق با بکارگیری رویکرد رده بندهای محلی و با استفاده از الگوریتم ماشین بردار پشتیبان(svm) ، یک سیستم خودکار جهت دسته بندی سلسله مراتبی اسناد متنی طراحی و پیاده سازی شده است. نتایج بدست آمده از ارزیابی این سیستم بر روی مجموعه ی اسناد دانشنامه حوزه نت مرکز تحقیقات کامپیوتری علوم اسلامی نور نشان داد که سیستم پیاده سازی شده از صحت و دقت بالایی در دسته بندی متون برخوردار است.