نام پژوهشگر: رضا شش بلوکی
رضا شش بلوکی حسام عمرانپور
دسته بندی یا تعیین نوع کلاس در یادگیری ماشین از اهمیت بسزایی برخوردار است. در واقع طبقه بندی اطلاعات روشی است که در همه علوم خواه یا ناخواه استفاده میشود. در علم کامپیوتر روش های بسیاری برای این مهم وجود دارد. هر روش نقطه ضعف و نقطه قوت خاص خود را دارد. اما در بعضی مواقع تنها یک روش برای طبقه بندی اطلاعات کافی نیست و مجبوریم که از چند روش و بررسی نتایج آنها این کار را انجام دهیم. راه های زیادی برای ترکیب طبقه بندی اطلاعات وجود دارد. اما با تغییر در روند ترکیب اطلاعات به روش دقیق تری دست پیدا میکنیم که بالطبع نتایج بهتری حاصل میشود. در روش پیشنهادی قبل از اجرای ترکیب دسته بندی کننده ها بر روی دسته بندی کننده ها عمل خوشه بندی صورت میگیرد. نوع الگوریتم خوشه بندیو همچنین تعداد کلاس ها یا لیبل ها اهمیتی ندارد. ما میتوانیم به روش های مختلف مانند k-means یا dbscan یا روش های دیگر خوشه بندی را انجام دهیم. بعد از انجام خوشه بندی و ایجاد کلاس های مختلف ، روی هر کلاس چند عمل کلاسه بندی)طبقه بندی( با روش های مختلف انجام میشود. هر روش خطای مربوط به خود را دارد. بعد از انجام این کار طبقه بندی کننده ها یا کلاسیفایر ها با هم ادغام شده. به بیان دیگر نتایج کلاسیفایر ها بررسی میشود و هر داده ای بنا به روش ترکیب کلاسیفایر مربوط به یک کلاس خاص میشود. الگوریتم ها و روش های زیادی برای ترکیب کلاسیفایر ها وجود دارد که در این پژوهش از الگوریتم adaboost که زیر مجموعه الگوریتم بوستینگ است استفاده شده. شرط استفاده از الگوریتم adaboost این است که کلاسیفایر ها نتایج بهتر از 5 % یا تصادفی داشته باشند.