یادگیری نیمه نظارتی کرنل مرکب با استفاده از تکنیک‌های یادگیری معیار فاصله

Authors

Abstract:

Distance metric has a key role in many machine learning and computer vision algorithms so that choosing an appropriate distance metric has a direct effect on the performance of such algorithms. Recently, distance metric learning using labeled data or other available supervisory information has become a very active research area in machine learning applications. Studies in this area have shown that distance metric learning-based algorithms considerably outperform the commonly used distance metrics such as Euclidean distance. In the kernelized version of the metric learning algorithms, the data points are implicitly mapped into a new feature space using a non-linear kernel function. The associated distance metric is then learned in this new feature space. Utilizing kernel function improves the performance of pattern recognition algorithms, however choosing a proper kernel and tuning its parameter(s) are the main issues in such methods. Using of an appropriate composite kernel instead of a single kernel is one of the best solutions to this problem. In this research study, a multiple kernel is constructed using the weighted sum of a set of basis kernels. In this framework, we propose different learning approaches to determine the kernels weights. The proposed learning techniques arise from the distance metric learning concepts. These methods are performed within a semi supervised framework where different cost functions are considered and the learning process is performed using a limited amount of supervisory information. The supervisory information is in the form of a small set of similarity and/or dissimilarity pairs. We define four distance metric based cost functions in order to optimize the multiple kernel weight. In the first structure, the average distance between the similarity pairs is considered as the cost function. The cost function is minimized subject to maximizing of the average distance between the dissimilarity pairs.  This is in fact, a commonly used goal in the distance metric learning problem. In the next structure, it is tried to preserve the topological structure of the data by using of the idea of graph Laplacian. For this purpose, we add a penalty term to the cost function which preserves the topological structure of the data. This penalty term is also used in the other two structures. In the third arrangement, the effect of each dissimilarity pair is considered as an independent constraint. Finally, in the last structure, maximization of the distance between the dissimilarity pairs is considered within the cost function not as a constraint.  The proposed methods are examined in the clustering application using the kernel k-means clustering algorithm. Both synthetic (a XOR data set) and real data sets (the UCI data) used in the experiments and the performance of the clustering algorithm using single kernels, are considered as the baseline. Our experimental results confirm that using the multiple kernel not only improves the clustering result but also makes the algorithm independent of choosing the best kernel. The results also show that increasing of the number of constraints, as in the third structures, leads to instability of the algorithm which is expected.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

حاشیه‌نویسی تصویر با استفاده از الگوریتم خوشه‌بندی نیمه نظارتی طیفی

Abstract: Due to the growth of digital images require efficient methods to annotate the images is sense. In this paper, a semi-supervised spectral clustering with relevance feedback is used to annotate digital photos which is overcome the local minima problem on clustering methods by using some labeled information given by users. Performance of the proposed method is tested on Corel 5K dataset ...

full text

شناسایی حرکات انسان در داده های ویدئویی با استفاده از روشهای یادگیری نیمه نظارتی

شناسایی حرکت انسان در داده های ویدئویی به عنوان یک موضوع پژوهشی مهم در حوزه بینایی ماشین، توجه بسیاری از محققان را به خود جلب کرده است. استخراج اطلاعات حرکتی انسان در ویدئو سبب کشف الگوهای مفید می شود که توسط آن ها می توان به طبقه بندی و خوشه بندی داده های ویدئویی پرداخت. بازشناسی و فهم خودکار اعمال انسان یک نیاز رو به افزایش در حوزه های کاربردی مهمی نظیر سیستم های امنیتی و نظارتی به ویژه در مک...

رخدادکاوی در داده های ویدئویی با استفاده از روش های یادگیری نیمه نظارتی

امروزه حجم زیادی از داده های ویدئویی در دسترس افراد است؛ داده های ویدئویی هم اکنون بیش از نیمی از ترافیک اینترنت را به خود اختصاص داده اند. سالانه 9000ساعت محصولات سینمایی و 8 میلیون ساعت محصولات تلویزیونی تولید می شود، این در حالی است که پیش بینی می شود تا سال 2014 بیش از 90% ظرفیت شبکه جهانی اینترنت به انتقال داده های ویدئویی اختصاص یابد. برای دسترسی کارا به این حجم عظیم داده، نیاز شدیدی به ا...

15 صفحه اول

ارائه یک مدل متن کاوی مبتنی بر یادگیری نیمه نظارتی

محبوبیت وب و حجم زیاد مستندات متنیِ الکترونیکی موجود، باعث افزایش نیاز به جستجو برای استخراج دانش نهان از مجموعه ی مستندات متنی شده است. بنابراین، امروزه مسئله ی متن کاوی در زمینه های متعددی از جمله پزشکی، زیست-فناوری، اقتصاد و فناوری اطلاعات مورد توجه قرار گرفته است. متن کاوی قادر است پردازش هایی مانند طبقه بندی، خوشه بندی، خلاصه سازی و استخراج اطلاعات متنی را پوشش دهد. طبقه بندی متون به شیوه ا...

15 صفحه اول

ارتقاء یادگیری آناتومی با استفاده از اشیاء یادگیری تکرارپذیر

Introduction: The use of modern educational technologies is useful for learning, durability, sociability, and upgrading professionalism. The aim of this study was evaluating the effect of reusable learning objects on improving learning of anatomy. Methods: This was a quasi-experimental study. Fourteen (reusable learning objects) RLO from different parts of anatomy of human body including tho...

full text

بازیابی تصاویر پزشکی با بهره گیری از رویکرد یادگیری نیمه نظارتی

در سال های اخیر تولید انبوهی از تصاویر و توزیع آن ها در سراسر جهان رشد چشمگیری داشته است. در بسیاری از زمینه ها مانند کاربردهای تجاری، کتابخانه های دیجیتال و بیمارستان ها، مجموعه های عظیمی از تصاویر دیجیتال ایجاد شده است. این گستره تولید، نیازمند توسعه ابزاری به منظور مدیریت و بازیابی مناسب در زمینه های مختلف می باشد. بازیابی تصویر مبتنی بر محتوی، به یافتن تصاویر با استخراج خودکار ویژگی های بصر...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 14  issue 1

pages  53- 70

publication date 2017-06

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023