نام پژوهشگر: پریسا کردجمشیدی

دسته بندی متون با روش یادگیری فعال
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس 1381
  پریسا کردجمشیدی   سعید جلیلی

امروزه با توجه به رشد روزافزون دسترسی به اسناد الکترونیکی از منابع مختلف، برای استفاده هر چه مفیدتر و دسترسی آسان به اسناد مطلوب، مساله دسته بندی خودکار اهمیت ویژه ای یافته است. این مساله هر چند در حوزه بازیابی اطلاعات قرار دارد اما روشهایی که در این زمینه بکار برده می شوند، روشهای هدایت شده یادگیری ماشین هستند.معمولا در این روشها، ساختن یک دسته بند با کارایی بالا نیاز به نمونه های برچسب خورده فراوانی دارد و این مستلزم صرف نیروی انسانی زیادی است که بسیار پر هزینه است. دراین تحقیق ضمن بررسی روشهای کلی دسته بندی متون و یادگیری فعال، دسته بندی پیشنهادشده است که در آن ابتدا یک دسته بند بیزین ساده اولیه با تعداد خیلی کمی اسناد برچسب دار ساخته می شود . سپس با استفاده از یادگیری فعال و بکارگیری روش نمونه گیری براساس عدم اطمینان به همراه ایده جدید مشابهت و انتخاب گروهی نمونه ها به صورت هدفمند ، نمونه های مفید را برای برچسب گذاری به کاربر می دهد تا در آموزش دسته بند از آنها استفاده کند.