خوشه‌بندی خودکار داده‌های مختلط با استفاده از الگوریتم ژنتیک

Authors

  • Vard, Mahdi MSc, School of Railway Engineering - Iran University of Science and Technology
  • Yaghini, Masoud Assistance professor of School of Railway Engineering - Iran University of Science and Technology
Abstract:

In the real world clustering problems, it is often encountered to perform cluster analysis on data sets with mixed numeric and categorical values. However, most existing clustering algorithms are only efficient for the numeric data rather than the mixed data set. In addition, traditional methods, for example, the K-means algorithm, usually ask the user to provide the number of clusters. In this paper, we propose a new method to cluster mixed data and automatically evolve the number of clusters as well as clustering of data set. In the proposed method, Davies-Bouldin Index is used as fitness function and we use the genetic algorithm to optimize fitness function. Also, we use a more accurate distance measure for calculating the distance between categorical values. The performance of this algorithm has been studied on real world and simulated data sets. Comparisons with other clustering algorithms illustrate the effectiveness of this approach.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

خوشه بندی خودکار داده های مختلط با استفاده از الگوریتم ژنتیک

مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشه­بندی در دنیای واقعی، اغلب با مجموعه داده­هایی مواجهیم که از ترکیبی از مقادیر عددی و دسته­ای تشکیل شده­اند. در حالیکه اغلب روشهای خوشه­بندی موجود تنها بر روی داده­های عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی داده­های مختلط را ندارند. از س...

full text

واسنجی خودکار دو مدل بارش‌- رواناب تانک و SIMHYD با استفاده از الگوریتم ژنتیک

شبیه‌‏سازی روابط بارش- رواناب کانون اصلی توجه تحقیقات هیدرولوژی در دهه‌‏های گذشته بوده و مدل‏‏های زیادی برای این منظور پیشنهاد شده است. انتخاب مدل به هدف از مدل‌سازی و اطلاعات در دسترس بستگی دارد. در این مطالعه، عملکرد نسبی دو مدل یکپارچه و مفهومی تانک[1] و SIMHYD  مقایسه شد. در هر دو مدل ذکرشده محدودة تغییرات پارامترها زیاد است؛ در نتیجه، استفاده از روش سعی و خطا برای بهینه‌سازی پارامترها مشکل...

full text

برآورد خودکار مشخصات حوضه با استفاده از خصوصیات هیدروگراف مشاهده‌ای، HEC-HMS، الگوریتم ژنتیک و AutoIt

مهمترین هدف در واسنجی مدل‌های مفهومی بارندگی-رواناب (CRR) پیدا کردن مقادیر بهینه برای مدل می‌باشد که با استفاده از آن بتوان بهترین منحنی را برای هیدروگراف‌های مشاهده‌ شده و محاسبه‌ شده برازش داد.  با وجود عمومیت این مدل‌ها، در صورتی که نتوان یک مقدار بهینه منحصر به فرد برای پارامترهای آن با استفاده از واسنجی خودکار به دست آورد، کاربرد آن مدل‌ها بسیار مشکل خواهد بود. همچنین استفاده از هیدروگراف‌...

full text

طراحی جدول زمانبندی خودکار برای دروس دانشگاهی با استفاده از الگوریتم های ژنتیک

طراحی جدول زمان­بندی، اساساً از وظایف پیچیده و وقت گیر برای پرسنل مسئول می­باشد که از طرفی انجام خودکار آن گامی در جهت کاهش بار کاری پرسنل و از سوی دیگر یک نمونه مطلوب برای امتحان روش­های برنامه­ریزی و ارضای محدودیت­ها در هوش مصنوعی است.  در این پژوهش، ابتدا  الگوریتم­های ژنتیک مطالعه و بررسی شده، سپس در مسأله بهینه سازی جدول زمانی دروس برای یک دانشکده فرضی مورد استفاده قرار گرفته است. د...

full text

واسنجی خودکار دو مدل بارش - رواناب تانک و simhyd با استفاده از الگوریتم ژنتیک

شبیه ‏سازی روابط بارش- رواناب کانون اصلی توجه تحقیقات هیدرولوژی در دهه ‏های گذشته بوده و مدل‏‏های زیادی برای این منظور پیشنهاد شده است. انتخاب مدل به هدف از مدل سازی و اطلاعات در دسترس بستگی دارد. در این مطالعه، عملکرد نسبی دو مدل یکپارچه و مفهومی تانک[1] و simhyd  مقایسه شد. در هر دو مدل ذکرشده محدودة تغییرات پارامترها زیاد است؛ در نتیجه، استفاده از روش سعی و خطا برای بهینه سازی پارامترها مشکل...

full text

ارزیابی عملکرد مدل‌های AWBM، Sacramento و SimHyd در شبیه‌سازی رواناب حوضه امامه با استفاده از بهینه‌ساز واسنجی خودکار الگوریتم ژنتیک

یکی از روش­های معتبر در شبیه­سازی فرآیند پیچیده و غیرخطی بارش–رواناب استفاده از مدل­های هیدرولوژیکی است. هدف مقاله حاضر بررسی کارایی سه مدل بارش-رواناب­ یکپارچه و مفهومی AWBM، Sacramento و SimHyd در شبیه­سازی رواناب روزانه در خروجی حوضه آبریز معرف امامه با کاربرد بهینه­ساز واسنجی خودکار الگوریتم ژنتیک است. مشابه سایر مدل­های هیدرولوژیکی، در هر سه مدل مذکور محدوده تغییر پارامترها زیاد است و با ت...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 23  issue 2

pages  187- 197

publication date 2012-08

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023