نام پژوهشگر: دانیال جلال نوری
دانیال جلال نوری محمد صنیعی آباده
امروزه با افزایش حجم اطلاعات تحقیقات فراوانی بر روی داده کاوی در بخش های مختلف انجام می شود و محققان از روش های متفاوت برای کاوش مجموعه داده ها استفاده می کنند. برخی محققان تلاش در طراحی روش هایی برای استخراج دانش از انواع متفاوت مجموعه های داده دارند. در مواردی حجم مجموعه داده بسیار بزرگ بوده و امکان استفاده از روش هایی که بر روی مجموعه داده های کوچک به درستی عمل می کند وجود ندارد. برای نمونه اخیراً داده های توصیف ژنی برای تشخیص بیماری سرطان بکار گرفته شده اند که این نوع داده ها از آزمایشات میکروآرایه استخراج می شوند. تعداد زیاد ژن ها و تعداد نمونه های کم به دلیل محدودیت در انجام آزمایشات، موجب پیچیدگی استخراج دانش از این نوع مجموعه داده ها شده است. در این پژوهش یک دسته بند فازی برای حل مسئله ی استخراج مجموعه قوانین به همراه برقراری موازنه میان دقت و تفسیرپذیری بر روی انواع مجموعه داده های بزرگ و کوچک ارائه شده است. در این دسته بند، دانش خروجی به صورت قوانین فازی نمایش داده می شود. توانایی سیستم های فازی در مدل کردن ابهام و قابل تفسیر بودن دانش خروجی کمک می کند تا راهکار پیشنهادی توسط متخصصان قابل فهم باشد. اما مفهوم قابلیت تفسیر و کارایی با یکدیگر نسبت عکس دارند که یکی از چالش های این پژوهش می باشد. یک سیستم فازی متشکل از مولفه های مبدل فازی، یادگیرنده ی قانون و مفسر فازی می باشد. در مبدل فازی ویژگی های مجموعه داده ای برای سادگی نرمال می شوند. مولفه ی یادگیرنده ی قانون از الگوریتم ژنتیک و رقابت استعماری در قالب یک الگوریتم ترکیبی برای استخراج قانون بهره می برد. در ارزیابی دقت 70.03 برای پایگاه داده 14_tumors و 85.38 بر روی pima به دست آمد که نشان می دهد راهکار پیشنهادی توانسته است به نتایج قابل قبولی در مقایسه با دیگر الگوریتم ها دست یابد.