نام پژوهشگر: عباس پیرمحمدی
عباس پیرمحمدی علی امیری
مسئله طبقه بندی داده های نامتوازن به عنوان یکی از چالش های اصلی در حوزه ی داده کاوی، مورد توجه بسیاری از محققان و پژوهش گران قرار گرفته است. در سال های اخیر تحقیقات ارزشمند زیادی برای حل مسئله طبقه بندی داده های نامتوازن انجام شده است. در بین این تحقیقات، رهیافت های مبتنی بر ترکیب طبقه بندها از موفقیّت قابل توجهی برخوردار بوده اند. علیرغم کارهای بسیار مؤثر انجام شده در ترکیب طبقه بندها هنوز برخی چالش ها از قبیل؛ عدم توجه به اهمیت نمونه ها در متوازن سازی، تعیین تعداد مناسب طبقه بندها و عدم بهینه سازی وزن طبقه بندها در ترکیب طبقه بندها به صورت حل نشده باقی مانده است. بنابراین در این پایان نامه تلاش شده است رهیافتی برای چالش های مطرح شده ارائه شود. در این راستا، ترکیبی از الگوریتم ها جهت ایجاد ساختار پیشنهادی ارائه شده است. سیستم پیشنهادی شامل 3 بخش کلی است: در بخش اول توصیف گر بردار پشتیبان داده جهت نمونه برداری از دو کلاس اقلیت و اکثریت استفاده شده است. این روش برخلاف روش های بیش نمونه برداری و زیر نمونه برداری از داده هایی که توصیف بهتری از کل داده ها دارد، نمونه برداری می کند. در بخش دوم تعداد بهینه طبقه بندهای پایه در ترکیب طبقه بندها برای نمونه های منتخب تعیین می شود و در بخش پایانی با استفاده از الگوریتم ژنتیک عمل بهینه سازی وزن ها در ترکیب طبقه بند انجام می شود. روش پیشنهادی با تعدادی از الگوریتم های موجود در این حوزه مقایسه شده و نتایج نشان دهنده مطلوبیت ساختار پیشنهادی در مقایسه با برخی از الگوریتم ها از لحاظ دقت است.