نام پژوهشگر: پریسا کردجمشیدی
پریسا کردجمشیدی سعید جلیلی
امروزه با توجه به رشد روزافزون دسترسی به اسناد الکترونیکی از منابع مختلف، برای استفاده هر چه مفیدتر و دسترسی آسان به اسناد مطلوب، مساله دسته بندی خودکار اهمیت ویژه ای یافته است. این مساله هر چند در حوزه بازیابی اطلاعات قرار دارد اما روشهایی که در این زمینه بکار برده می شوند، روشهای هدایت شده یادگیری ماشین هستند.معمولا در این روشها، ساختن یک دسته بند با کارایی بالا نیاز به نمونه های برچسب خورده فراوانی دارد و این مستلزم صرف نیروی انسانی زیادی است که بسیار پر هزینه است. دراین تحقیق ضمن بررسی روشهای کلی دسته بندی متون و یادگیری فعال، دسته بندی پیشنهادشده است که در آن ابتدا یک دسته بند بیزین ساده اولیه با تعداد خیلی کمی اسناد برچسب دار ساخته می شود . سپس با استفاده از یادگیری فعال و بکارگیری روش نمونه گیری براساس عدم اطمینان به همراه ایده جدید مشابهت و انتخاب گروهی نمونه ها به صورت هدفمند ، نمونه های مفید را برای برچسب گذاری به کاربر می دهد تا در آموزش دسته بند از آنها استفاده کند.