ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Authors

Abstract:

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algorithms for categorical data. The clustering algorithms for categorical data are more important than clustering algorithms for numerical data because of the nature and application of these data. Each of these algorithms uses different similarity measures according to the type of data (numeric or categorical). In this paper, a new clustering method is proposed for clustering by combining Overlay and Jaccard similarity measures on a hierarchical algorithm for categorical data. Overlay measure represents similarities between the data as one and zero which caused the loss of some information. Jaccard measure If used alone to measure the similarity between data set, most clusters are selected in the particular area of data collection. So in this paper a combination of the two measures are used. Experimental results show that the proposed method improves the results of clustering. Resulted improvemen is 10% on any evaluation factor in average.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

full text

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

full text

ارائه یک روش ترکیب دسته بندی کننده ها بر اساس خوشه بندی داده ها

دسته بندی یا تعیین نوع کلاس در یادگیری ماشین از اهمیت بسزایی برخوردار است. در واقع طبقه بندی اطلاعات روشی است که در همه علوم خواه یا ناخواه استفاده میشود. در علم کامپیوتر روش های بسیاری برای این مهم وجود دارد. هر روش نقطه ضعف و نقطه قوت خاص خود را دارد. اما در بعضی مواقع تنها یک روش برای طبقه بندی اطلاعات کافی نیست و مجبوریم که از چند روش و بررسی نتایج آنها این کار را انجام دهیم. راه های زیا...

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

full text

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 5  issue 1

pages  14- 25

publication date 2017-03

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023