نام پژوهشگر: حمیدرضا علینقیان جوزدانی
حمیدرضا علینقیان جوزدانی ناصر قاسم آقایی
با رشد روز افزون سیستم های کامپیوتری و داده های ذخیره شده در آن ها، تکنیک ها و روش های مختلف داده کاوی توسعه داده شده است. یکی از این روش ها خوشه بندی داده است. اهمیت و کاربرد این روش داده کاوی بر هیچ محقق و متخصصی در زمینه ی سیستم های اطلاعاتی پوشیده نیست. با نگاهی گذرا به حوزه ی تحقیقات در 2-3 دهه ی اخیر، گستردگی دامنه ی کاربرد خوشه بندی داده ها به خوبی مشاهده می شود. اما دو چالش بزرگ در این زمینه پیش روی دانشمندان و محققین بوده است. خوشه بندی داده ها به علت پیچیدگی محاسباتی بالا و همچنین گستردگی کاربرد با مشکلاتی روبرو است. به دلیل پیچیدگی محاسباتی بالا به دست آوردن بهترین مجموعه ی خوشه با روش های دقیق ممکن نیست بنابراین باید با تکنیک های مختلف حل مسئله ی np سخت، نتیجه ی بهینه یا نزدیک به بهینه ی خوشه بندی را بدست آورد. اغلب محققین در این زمینه به این مهم پرداخته اند. از طرفی به دلیل گستردگی کاربرد خوشه بندی و حوزه ی کاربردی آن ایجاد الگوریتم جامع عمومی برای همه ی کاربردها غیر ممکن است. در این کار سعی شده است با استفاده از روش کلونی مورچه ها که اغلب در مسائل بهینه سازی کاربرد دارد و معرفی ویژگی های جدیدی برای الگوریتم کلونی مورچگان از جمله موازی سازی فعالیت عامل ها، بسط مفهوم حافظه ی مورچه، بازتعریف مفهوم فرومون و مکانیزم فرومون گذاری جدید و امکان برقراری ارتباط بین مورچه ها به صورت مستقیم علاوه بر ارتباط غیرمستقیم بر پایه ی فرومون و الهام از روش های خوشه بندی dbscan و optics در رفتار عامل و بکارگیری تابع فاصله ی مرکب برای پشتیبانی از انواع مختلف داده، الگوریتمی مبتنی بر کلونی مورچه ها ارائه شود که داده ها را، با انواع صفات متفاوت در حجم بالا، خوشه بندی کند. در پایان روش پیشنهادی از طریق مقایسه با روش های متداول مانند k-means و روش های مشابه مانند antclass و anttree بر روی مجموعه داده های استاندارد موجود از طریق معیارهایی چون f-measure و rand index ارزیابی شده است. نتایج نشان می دهد الگوریتم پیشنهادی دقت و خلوص قابل مقایسه ای دارد و کارایی مناسبی ارائه می کند.