نام پژوهشگر: قاسم عبیداوی
قاسم عبیداوی حنیف حیدری
یکی از علوم جدیدی که توجه ویژه به آن شده است علم داده کاوی است. این علم بانک های اطلاعاتی و مجموعه های حجیم داده ها را مورد بررسی قرار می دهد. هدف داده کاوی کشف، استخراج دانش و تحلیل داده ها است. یکی از شاخه های علم داده کاوی، طبقه بندی می باشد. هدف طبقه بندی افراز مجموعه ی داده ها به طبقه هایی است که داده های هر طبقه دارای ویژگی های خاص و مشترکی هستند. با توجه به حجیم بودن داده ها و این که ممکن است داده ها چند بعدی باشند طبقه بندی کار ساده ای نیست. به همین دلیل از روابط ریاضی و علم هوش مصنوعی نیز برای طبقه بندی استفاده می کنیم.در این پژوهش توجه خود را به رده خاصی از طبقه بندی به نام طبقه بندی دودویی معطوف می نماییم. طبقه بندی دودویی نوعی طبقه بندی است که در آن داده ها به دو دسته تقسیم بندی می شوند. در همه انواع طبقه بندی های دودویی معمولا از یک تابع حقیقی که برد آن مجموعه {0و1} است برای یادگیری طبقه بندی استفاده می شود. سپس این تابع برای نمونه های جدید بکار برده می شود و مقدار آنها نشان می دهد که چه نمونه ای در چه طبقه ای جای گیرد.دیگر الگوریتم برای حل مساله طبقه بندی، تحلیل پوششی داده ها (dea) است. تحلیل پوششی داده ها که توسط چارنز و دیگران توسعه داده شده است یک روش غیر پارامتری برای تشخیص کارایی گروهی از واحدهای تصمیم گیرنده (dmu) است. هر واحدهای تصمیم گیرنده از چندین ورودی برای تولید تعدادی خروجی استفاده می کند. تحلیل پوششی داده ها واحدهای تصمیم گیرنده را به دو گروه واحد تصمیم گیرنده کارا و واحد تصمیم گیرنده ناکارا تقسیم بندی می کند. بنابراین می توان از آن برای حل مساله طبقه بندی دودویی استفاده کرد. مدل های bcc و ccr در تحلیل پوششی داده ها برای حل مساله طبقه بندی دودویی معرفی شده اند. برای حل مساله با این مدل ها واحدهای تصمیم گیرنده باید دارای خاصیت یکنوایی و ورودی ها نامنفی باشند. اما بسیاری از مسایل طبقه بندی دارای داده های منفی هستند و یا داده ها در خاصیت یکنوایی صدق نمی کنند. در این حالت، dea به تنهایی قادر به حل مساله طبقه بندی نیست. برای رفع این اشکالات از توابع پایه شعاعی استفاده می شود.