EFM-DBSCAN: Ein baumbasierter Clusteringalgorithmus unter Ausnutzung erweiterter Leader-Umgebungen

نویسنده

  • Philipp Egert
چکیده

DBSCAN ist ein dichte-basierter Clusteringalgorithmus, der beliebig geformte Cluster erkennt und sie von Rauschen trennt. Aufgrund der Laufzeit von O(n2) ist seine Anwendung jedoch auf kleine Datenkollektionen beschränkt. Um diesen Aufwand zu reduzieren, wurde der auf dem Konzept der Leader-Umgebung basierende Algorithmus FM-DBSCAN vorgestellt, der für beliebige Metriken dasselbe Clustering wie DBSCAN liefert. In dieser Arbeit wird nun basierend auf FM-DBSCAN das Verfahren EFM-DBSCAN entwickelt. EFM-DBSCAN nutzt die folgenden zwei Konzepte zur Eizienzsteigerung: (a) eine baumbasierte Partitionierung und (b) die Erweiterung der Objekte einer Leader-Umgebung um die Distanzen zu ihrem Leader. Erste Experimente zeigen, dass EFM-DBSCAN bis zu einem Faktor 17 weniger Distanzberechnungen und bis zu einem Faktor 13 weniger Rechenzeit als FM-DBSCAN benötigt. Gegenüber DBSCAN wurde ein Faktor von bis zu 104 eingespart.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

FM-DBSCAN: Ein effizienter, dichte-basierter Clustering-Algorithmus

DBSCAN ist ein dichte-basierter Clustering-Algorithmus, der Cluster beliebiger Form auffindet und diese von Rauschen trennt. Aufgrund des quadratischen Aufwands ist DBSCAN für große Datenmengen jedoch oft ungeeignet. In dieser Arbeit wird deshalb ein effizienterer Algorithmus namens FM-DBSCAN vorgestellt, der für eine beliebige Distanzfunktion (Metrik) dasselbe Ergebnis wie DBSCAN liefert. Hier...

متن کامل

Dezentrale Steuerung verteilter Anwendungen mit rationalen Agenten

Herkömmliche Methoden für die Steuerung und Koordination verteilter Anwendungen mit weitgehend autonomen Diensten und Prozessen in heterogenen, sich dynamisch ändernden Umgebungen beruhen oft auf zentralen Steuerungskomponenten und statischen Zustandsund Prozessbeschreibungen. Sie berücksichtigen damit sowohl die Autonomie der Teilprozesse als auch die Dynamik des Anwendungskontextes noch zu we...

متن کامل

Methoden zum Schutz von Verkehrsdaten in Funknetzen

Die Verwendung elektromagnetischer Wellen für die Übertragung von Daten im freien Raum birgt Probleme bezüglich des Datenschutzes. Daher sucht das vorliegende Papier unter dem Aspekt des technischen Datenschutzes nach Möglichkeiten, die Peilung von aktiven Sendeeinrichtungen, hier spezieller Mobilfunksender, zu verhindern. Das angestrebte Ziel ist, die Nichtortbarkeit einer Mobilstation und dam...

متن کامل

Die (technischen) Potenziale digitaler Tafeln

Dieser Beitrag erläutert die technischen Potenziale digitaler Tafeln, mit denen mehr und mehr Schulen ausgestattet werden. In einer Betrachtung aktueller Nutzungsszenarien dieser interaktiven Whiteboards wird herausgearbeitet, dass ein Großteil dieser Potenziale noch ungenutzt ist und die Defizite der Software insbesondere für den Einsatz in einem anspruchsvollen, schülerorientierten Unterricht...

متن کامل

"Gefällt mir" - Anreicherung von kontextspezischem Endbenutzer-Feedback um die Meinungen, Ideen und Bewertungen Anderer in sozialen Netzwerken

Das Requirements Engineering kann heutzutage durch neue Technologien unterstützt werden bspw. durch die Benutzung von Smartphones [5, 6]. Unter Ausnutzung des Kontext können Endbenutzer Feedback geben, um sich an der Verbesserung von Systemen, zum Beispiel in ITÖkosystemen [2], zu beteiligen. Dieses Feedback ist mehr oder weniger willkürlich, d.h. aus der Situation heraus ohne Bezug zu anderem ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2017