بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائه‌شده برای آن

Authors

Abstract:

Clustering is an important knowledge discovery technique in the database. Density-based clustering algorithms are one of the main methods for clustering in data mining. These algorithms have some special features including being independent from the shape of the clusters, highly understandable and ease of use. DBSCAN is a base algorithm for density-based clustering algorithms. DBSCAN is able to detect clusters with different sizes and shapes in huge amounts of data and is also resistant to noise. Despite its advantages, this algorithm has its own drawbacks such as the difficulty in determining appropriate values for input parameters, inability to detect clusters with different density and inability to detect appropriate clusters when they are too close. Since 1996 that DBSCAN has been introduced, many different algorithms have been proposed as improvements of DBSCAN. In this paper, firstly the drawbacks of DBSCAN algorithm are discussed. Secondly, we review and discuss DBSCAN improvement algorithms in order to know the pros and cons of each algorithm and their success in improving DBSCAN algorithm. We also implemented some of these algorithms according to our studies and tested them according to the clustering evaluation criteria on standard data sets, so that we would to be able to judge the algorithms better.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

الگوریتم ژنتیک آشوب گونه مبتنی بر حافظه و خوشه بندی برای حل مسائل بهینه سازی پویا

چکیده: اکثر مسائل موجود در دنیای واقعی یک مسئله بهینه­سازی با ماهیتی پویا هستند، به‌طوری‌که مقدار بهینه سراسری آن­ها در طول زمان ممکن است تغییر کند، بنابراین برای حل این مسائل الگوریتم­هایی نیاز داریم که بتوانند خود را با شرایط این مسائل به­خوبی سازگار نموده و بهینه جدید را برای این مسائل ردیابی نمایند. در این مقاله، یک الگوریتم ژنتیک آشوب­گونه مبتنی بر خوشه­بندی و حافظه برای حل مسائل پویا ارائ...

full text

ارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2

One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...

full text

استفاده از خوشه بندی دو مرحله‌ای برای بررسی تاثیر سهمیه بندی بنزین بر رفتار مصرف‌کنندگان

بخش حمل و نقل جاده‌ای بزرگترین بخش مصرف‌کننده‌ی بنزین در کشور است که با رشد مداوم تقاضای انرژی در طول زمان، در دهه‌های اخیر با چالش‌های بزرگی مواجه بوده است. مهم‌ترین این چالش‌ها، کمبود عرضه‌ی بنزین مصرفی بوده است. برای جبران این کمبود، دولت ناچار به واردات بنزین به مقدار زیاد بوده که اختلاف قیمت خرید و فروش و پرداخت یارانه فشار مالی زیادی بر دولت وارد می‌کرده است. در گام نخست دولت در تیر ماه س...

full text

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

full text

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 6  issue 1

pages  2- 37

publication date 2017-05

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023