نام پژوهشگر: زینب ترابی دشتی
زینب ترابی دشتی حسام عمرانپور
خوشه بندی یکی از اعمال اصلی در داده کاوی می باشد که به معنای گروه بندی نمونه¬های مشابه است. این تکنیک به دنبال کشف ساختار در داده¬ها از طریق بررسی شباهت¬ها و تفاوت¬های میان آنهاست.به طورکلیدسته بندی متنوعی از الگوریتم¬های خوشه بندی وجود دارد.نوعیاز این دسته بندی الگوریتم¬ها رابه دو دسته روش¬های تفکیکی و روش¬های سلسله مراتبی تقسیم می کند.در این پایان نامه به یکی از الگوریتم¬هایخوشه بندی تفکیکی به نامk-medoids پرداخته شده است. الگوریتم خوشه بندی pam یکی از اولین و ساده ترین انواع الگوریتم k-medoids به شمار می آید که به دلیل انتخاب تصادفی اشیاء نماینده و غیرنماینده در ابتدای الگوریتمبه بهینه محلی همگرا بوده و لزوما جواب بهینه رادر خوشه بندی تولید نمی کند. در این مقاله با استفاده از الگوریتم بهینه سازی گروه ذرات، دو روش جهت بهبود این الگوریتم خوشه بندی ارائه شده است. اولین روش پیشنهادی از الگوریتم بهینه سازی گروه ذرات درجهت خوشه بندی داده ها با هدف بهینه نمودن تابع هزینه در الگوریتم pam استفاده شده است. در دومین روش پیشنهادی به ترکیب دو الگوریتم مذکور (pso+pam) می پردازیم، که هدف از به کار بردن الگوریتم بهینه سازی گروه ذرات در این مدل ترکیبی، تعیین بهترین غیر نماینده ها در الگوریتم pamاست. در بخش ارزیابی، دو الگوریتم جدید با مجموعه داده های مختلف تست و نتایج حاصل از آنها با الگوریتم خوشه بندی pamمقایسه میشود. بررسی نتایج بدست آمده نشان می دهد که الگوریتم ترکیبی پیشنهادی نسبت به سایر الگوریتمهای خوشه بندی مورد بررسی از کارایی و اثربخشی بالاتری جهت خروج از مینیمم محلی و رسیدن جواب بهینه خوشه بندی برخوردار است.