Разработка ансамбля алгоритмов кластеризации на основе изменяющихся метрик расстояний (Development of the Clustering Algorithms Ensemble Based on Varying Distances Metrics)
نویسندگان
چکیده
В настоящее время происходит активное накопление данных большого объёма в различных информационных средах, таких как социальные, корпоративные, научные и другие. Интенсивное использование больших данных в различных областях стимулирует повышенный интерес исследователей к развитию методов и средств обработки и анализа массивных данных огромных объёмов и значительного многообразия. Одним из перспективных направлений в аналитике интенсивных данных является кластерный анализ, который позволяет решить такие задачи как, сокращение размерности исходного набора данных, выявление паттернов и т.д. В данной статье авторами предлагается ансамбль алгоритмов кластеризации, состоящий из базовых алгоритмов K-means, отличающихся по одному параметру метрике расстояния между объектами. Для оценки работы разработанного ансамбля использованы открытые данные архива UCI.
منابع مشابه
Разработка ансамбля алгоритмов классификации с использованием энтропийного показателя качества для решения задачи поведенческого скоринга (Development of an Ensemble of Classification Algorithms Using the Entropy Quality Measure for Solving the Problem of Behavioral Scoring)
متن کامل
Разработка семантических электронных библиотек на основе онтологических моделей (Development of Semantic Digital Libraries on the Basis of the Ontological Models)
متن کامل
Оценка эффективности метода параллельной реализации процесса кластеризации электронных документов на основе алгоритма FRiS-Cluster (Evaluating the Effectiveness of the Method of the Parallel Implementation of the Process of Clustering Text Documents on the Basis of the Algorithm FRiS-Cluster)
متن کامل
Algorithms of Diagnosis and Differentiated Microsurgical Treatment of Primary and Relapsing Lumbar Disc Hernias
Цель исследования. Разработка алгоритма дифференцированного выбора микрохирургического доступа и использования эндоскопического видеомониторинга в зависимости от фазы клинического течения заболевания и результатов лучевого обследования. Материалы и методы. Исследование проведено на основе анализа 542 случаев диагностики и оперативного лечения больных с первичными – 489 (90,2 %) человек и рециди...
متن کاملWeighted Ensemble Clustering for Increasing the Accuracy of the Final Clustering
Clustering algorithms are highly dependent on different factors such as the number of clusters, the specific clustering algorithm, and the used distance measure. Inspired from ensemble classification, one approach to reduce the effect of these factors on the final clustering is ensemble clustering. Since weighting the base classifiers has been a successful idea in ensemble classification, in th...
متن کامل