راه کاری برای کلاسه بندی داده های چندبرچسبی

پایان نامه
چکیده

برخلاف کلاسه بندی سنتی داده های تک برچسبی که در آن هر نمونه ورودی تنها با یک برچسب کلاس مشارکت داشت، در کلاسه بندی داده های چند برچسبی هر نمونه ورودی با مجموعه ای از برچسب ها مشارکت دارد. به دلیل وجود چندین برچسب کلاس، فرآیند یادگیری تحت تأثیر قرار می گیرد و کلاسه بندهای پایه ی مورد استفاده در داده های تک برچسبی، قابل استفاده نمی باشند. برای رفع این مشکل روش های تغییر مسئله معرفی شده اند. این دسته از روش ها مجموعه ی داده ها را به گونه ای تغییر می دهند تا بتوان کلاسه بندهای معمول را مورد استفاده قرار داد. با وجود آسانی استفاده از این دسته از روش ها، دو چالش کارایی و ارتباط بین برچسب ها از مباحث بحث برانگیز در تحقیقات اخیر می باشند. با توجه به کارایی بسیار خوب و قابلیت انعطاف بالای الگوریتم های یادگیری جمعی در زمینه های مختلف یادگیری ماشین، به کارگیری این گونه الگوریتم ها روش مناسب و موثری برای بهبود یادگیری از مجموعه داده های چندبرچسبی به نظر می رسد. در این مطالعه، الگوریتم جدیدی به نام lbr معرفی شده است که در دسته ی روش های یادگیری جمعی قرار دارد و در مقایسه با روش rakel که از مفهوم الگوریتم های یادگیری جمعی استفاده می کند، به نتایج بهتری رسیده است. روش lbr از کلاسه بندی محلی نمونه ها استفاده می کند. همچنین، اخیرا مسئله ارتباط بین برچسب ها در روش دیگری با نام cc مورد بررسی قرار گرفته است. این روش از کارایی پیش بینی بالایی برخوردار است. مشکل اصلی این روش عدم در نظر گرفتن ترتیب مشخصی از برچسب ها در زنجیره ی خود است. در گام بعدی در این رساله، دو روش fbcc و wbcc به منظور ارائه ی ترتیبی از برچسب ها با بیشترین میزان وابستگی به مجموعه ی ویژگی ها، معرفی شده اند. ارزیابی های تجربی روی طیف وسیعی از مجموعه های داده ای چند برچسبی حاکی از بهبود کارایی کلاسه بندی در روش های پیشنهادی نسبت به روش های پیشین می باشد.

منابع مشابه

جانشینی مقادیر مفقود و تأثیر آن بر دقت کلاسه بندی در داده کاوی پزشکی

مقدمه: وجود مقادیر مفقود در داده‌های پزشکی می‌تواند تمام فرآیند داده کاوی و تفسیرهای حاصل را تحت تأثیر قرار دهد. بنابراین برخورد با این مقادیر ضروری می‌باشد. در این پژوهش تأثیر روش‌های مختلف برخورد با مقادیر مفقود بر روی دقت کلاسه‌بندی داده‌های پزشکی مورد ارزیابی قرار گرفت.  روش: در این مطالعه، تأثیر روش‌های معروف جانشینی مقادیر مفقود شامل Mean/mode، Hot Deck، K-Nearest Neighbor، Maximum Possib...

متن کامل

جانشینی مقادیر مفقود و تأثیر آن بر دقت کلاسه بندی در داده کاوی پزشکی

مقدمه: وجود مقادیر مفقود در داده‌های پزشکی می‌تواند تمام فرآیند داده کاوی و تفسیرهای حاصل را تحت تأثیر قرار دهد. بنابراین برخورد با این مقادیر ضروری می‌باشد. در این پژوهش تأثیر روش‌های مختلف برخورد با مقادیر مفقود بر روی دقت کلاسه‌بندی داده‌های پزشکی مورد ارزیابی قرار گرفت.  روش: در این مطالعه، تأثیر روش‌های معروف جانشینی مقادیر مفقود شامل Mean/mode، Hot Deck، K-Nearest Neighbor، Maximum Possib...

متن کامل

طبقه بندی راه های شهری مبتنی بر ادغام در سطح تصمیمات داده های نوری و راداری

در این مقاله قابلیت تصاویر اسپات و سار به منظور تشخیص عارضه راه در مناطق شهری مورد بررسی قرار گرفته است. شباهت طیفی عارضه راه با سقف آسفالت ساختمان ها در مناطق شهری موجب بروز مشکلاتی در تشخیص راه مبتنی بر داده های اپتیک از جمله اسپات می گردد. از سوی دیگر، تصاویر سار با اینکه قابلیت خوبی در تشخیص راههای فرعی و باریک دارند، اما در تشخیص راه از پوشش گیاهی دچار مشکلاتی می شود. بنابراین، نتایج حاصل ...

متن کامل

راستی سنجی داده های ژئوتکنیکی تونل راه آهن قزوین ـ رشت با استفاده از تحلیل برگشتی داده های ابزار بندی

انواع مختلفی از تحلیل­های عددی مانند روش عناصر محدود، روش عناصر مرزی و روش عناصر مجزا در مکانیک سنگ و در کارهای مهندسی برای طراحی سازه‌های سنگی مانند تونل‌ها، حفریات زیرزمینی، شیب‌ها، فونداسیون سد و ... استفاده می‌شوند. در این مقاله، نتایج حاصل از تحلیل برگشتی تونل کوهین واقع در قطعۀ اول راه آهن قزوین ـ رشت ارائه شده است. هدف اصلی این پژوهش اجرای تحلیل برگشتی تونل یادشده با استفاده از مدل‌های ع...

متن کامل

ارائه راه کاری برای افزایش کارایی در خوشه بندی داده ها با استفاده از فازی نوع ?

تحلیل داده ها زمینه مناسبی را برای بسیاری از کاربرد های محاسباتی فراهم آورده است. تحلیل خوشه بندی، سازمان دهی مجموعه ای از نمونه ها بر اساس شباهت میان آنها درون گروه های مجزا می باشد. نمونه های درون یک خوشه نسبت به نمونه های دیگر خوشه ها بسیار مشابه یکدیگر هستند. یک الگوریتم خوشه بندی سخت، هر نمونه را فقط به یک خوشه نسبت می دهد، در حالی که خوشه بندی فازی هر نمونه را با درجات عضویت متفاوت درون چ...

بررسی راه های عملی تقویت وجدان کاری

برای بحث پیرامون این مقوله ابتدا به تعریف «وجدان» و معنای آن در فارسی و عربی و همین طور لاتین (انگلیسی) که زبان علمی مدیریت است می پردازیم و سپس وجدان کار در مدیریت اسلامی (یا جهان بینی الهی) و چگونگی تقویت آن و بعد وجدان کار (Responsiblity) در مدیریت علمی (جهان بینی مادی) مورد بررسی و سپس وجدان کار و مسؤولیت پذیری را از دیدگاه نویسنده و جمعی اساتید دانشگاه های کشور از طریق یک روش تحقیق تجربی (...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023