نام پژوهشگر: زاهده ایزکیان

داده کاوی مسیر با توسعه روش خوشه بندی fcm
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده نقشه برداری 1392
  زاهده ایزکیان   محمدسعدی مسگری

با پیشرفت روز افزون تکنولوژی های جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روش هایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن می باشیم. چگونگی استخراج اطلاعات مفید از میان این داده های خام همواره یکی از سوالات اساسی در علوم کامپیوتر بوده است و داده کاوی یکی از مهمترین روش های حل این مسئله است. خوشه بندی داده نیز از پرکاربردترین زمینه های داده کاوی محسوب شده و توجه بسیاری از محققین را در علوم مختلف به خود جلب کرده است. در سال های اخیر مسئله ی خوشه بندی مسیر اشیاء متحرک بدلیل کاربردهای مختلف علاقه ی محققین را به خود جلب کرده و الگوریتم های بسیاری در این زمینه پیشنهاد داده شده است. استفاده از الگوریتم های هوش جمعی در حل بعضی از مسائل خوشه بندی و ارزیابی نتایج حاصل، توانمندی این الگوریتم ها را در این زمینه ها به خوبی نشان می دهد. در این تحقیق از الگوریتم انبوه ذرات که در گروه الگوریتم های خوشه بندی مبتنی بر هوش جمعی می باشد، برای افزایش کارایی روش خوشه بندی fcm (یکی از روش های مشهور خوشه بندی) استفاده گردید. بدین صورت که در روش ارائه شده که hpso)hybrid pso) نام گرفت، یافتن مراکز خوشه ها و تعیین تعداد بهینه ی خوشه ها به عهده ی الگوریتم انبوه ذرات می باشد. تابع هدف استفاده شده در این روش قابلیت تعیین تعداد خوشه ها را دارا می باشد. در روش پیشنهادی برای کاهش مجهولات موجود در هر ذره که همان المان های مراکز خوشه ها می باشند روش های مختلف نمایش داده های مکانی-زمانی را مورد بررسی قرار دادیم و از این میان روش ضرایب dct را برای کاهش مجهولات مراکز خوشه ها انتخاب کردیم. بدین مفهوم که الگوریتم انبوه ذرات انتخابی برای خوشه بندی، به جای یافتن تمامی المان های مراکز خوشه های موجود در مجموعه داده، تنها تعداد محدودی از ضرایب dct این مراکز را یافته و سپس با استفاده از همین ضرایب محدود مراکز خوشه ها بازسازی می شوند. الگوریتم پیشنهادی با در نظر گرفتن سه تابع فاصله ی مختلف بر روی چهار سری مجموعه داده ی شبیه سازی شده و واقعی پیاده سازی شد. در پایان مقدار تابع هدف بدست آمده از روش پیشنهادی (hpso) و چهار الگوریتم دیگر با هم مقایسه گردیدند. از مجموع 12 حالت، در 11 مورد، روش ارائه شده بهترین جواب را به خود اختصاص داد.