راه کاری برای کلاسه بندی داده های چندبرچسبی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
- نویسنده مریم کیخا
- استاد راهنما ستار هاشمی اقبال منصوری
- سال انتشار 1393
چکیده
برخلاف کلاسه بندی سنتی داده های تک برچسبی که در آن هر نمونه ورودی تنها با یک برچسب کلاس مشارکت داشت، در کلاسه بندی داده های چند برچسبی هر نمونه ورودی با مجموعه ای از برچسب ها مشارکت دارد. به دلیل وجود چندین برچسب کلاس، فرآیند یادگیری تحت تأثیر قرار می گیرد و کلاسه بندهای پایه ی مورد استفاده در داده های تک برچسبی، قابل استفاده نمی باشند. برای رفع این مشکل روش های تغییر مسئله معرفی شده اند. این دسته از روش ها مجموعه ی داده ها را به گونه ای تغییر می دهند تا بتوان کلاسه بندهای معمول را مورد استفاده قرار داد. با وجود آسانی استفاده از این دسته از روش ها، دو چالش کارایی و ارتباط بین برچسب ها از مباحث بحث برانگیز در تحقیقات اخیر می باشند. با توجه به کارایی بسیار خوب و قابلیت انعطاف بالای الگوریتم های یادگیری جمعی در زمینه های مختلف یادگیری ماشین، به کارگیری این گونه الگوریتم ها روش مناسب و موثری برای بهبود یادگیری از مجموعه داده های چندبرچسبی به نظر می رسد. در این مطالعه، الگوریتم جدیدی به نام lbr معرفی شده است که در دسته ی روش های یادگیری جمعی قرار دارد و در مقایسه با روش rakel که از مفهوم الگوریتم های یادگیری جمعی استفاده می کند، به نتایج بهتری رسیده است. روش lbr از کلاسه بندی محلی نمونه ها استفاده می کند. همچنین، اخیرا مسئله ارتباط بین برچسب ها در روش دیگری با نام cc مورد بررسی قرار گرفته است. این روش از کارایی پیش بینی بالایی برخوردار است. مشکل اصلی این روش عدم در نظر گرفتن ترتیب مشخصی از برچسب ها در زنجیره ی خود است. در گام بعدی در این رساله، دو روش fbcc و wbcc به منظور ارائه ی ترتیبی از برچسب ها با بیشترین میزان وابستگی به مجموعه ی ویژگی ها، معرفی شده اند. ارزیابی های تجربی روی طیف وسیعی از مجموعه های داده ای چند برچسبی حاکی از بهبود کارایی کلاسه بندی در روش های پیشنهادی نسبت به روش های پیشین می باشد.
منابع مشابه
جانشینی مقادیر مفقود و تأثیر آن بر دقت کلاسه بندی در داده کاوی پزشکی
مقدمه: وجود مقادیر مفقود در دادههای پزشکی میتواند تمام فرآیند داده کاوی و تفسیرهای حاصل را تحت تأثیر قرار دهد. بنابراین برخورد با این مقادیر ضروری میباشد. در این پژوهش تأثیر روشهای مختلف برخورد با مقادیر مفقود بر روی دقت کلاسهبندی دادههای پزشکی مورد ارزیابی قرار گرفت. روش: در این مطالعه، تأثیر روشهای معروف جانشینی مقادیر مفقود شامل Mean/mode، Hot Deck، K-Nearest Neighbor، Maximum Possib...
متن کاملجانشینی مقادیر مفقود و تأثیر آن بر دقت کلاسه بندی در داده کاوی پزشکی
مقدمه: وجود مقادیر مفقود در دادههای پزشکی میتواند تمام فرآیند داده کاوی و تفسیرهای حاصل را تحت تأثیر قرار دهد. بنابراین برخورد با این مقادیر ضروری میباشد. در این پژوهش تأثیر روشهای مختلف برخورد با مقادیر مفقود بر روی دقت کلاسهبندی دادههای پزشکی مورد ارزیابی قرار گرفت. روش: در این مطالعه، تأثیر روشهای معروف جانشینی مقادیر مفقود شامل Mean/mode، Hot Deck، K-Nearest Neighbor، Maximum Possib...
متن کاملطبقه بندی راه های شهری مبتنی بر ادغام در سطح تصمیمات داده های نوری و راداری
در این مقاله قابلیت تصاویر اسپات و سار به منظور تشخیص عارضه راه در مناطق شهری مورد بررسی قرار گرفته است. شباهت طیفی عارضه راه با سقف آسفالت ساختمان ها در مناطق شهری موجب بروز مشکلاتی در تشخیص راه مبتنی بر داده های اپتیک از جمله اسپات می گردد. از سوی دیگر، تصاویر سار با اینکه قابلیت خوبی در تشخیص راههای فرعی و باریک دارند، اما در تشخیص راه از پوشش گیاهی دچار مشکلاتی می شود. بنابراین، نتایج حاصل ...
متن کاملراستی سنجی داده های ژئوتکنیکی تونل راه آهن قزوین ـ رشت با استفاده از تحلیل برگشتی داده های ابزار بندی
انواع مختلفی از تحلیلهای عددی مانند روش عناصر محدود، روش عناصر مرزی و روش عناصر مجزا در مکانیک سنگ و در کارهای مهندسی برای طراحی سازههای سنگی مانند تونلها، حفریات زیرزمینی، شیبها، فونداسیون سد و ... استفاده میشوند. در این مقاله، نتایج حاصل از تحلیل برگشتی تونل کوهین واقع در قطعۀ اول راه آهن قزوین ـ رشت ارائه شده است. هدف اصلی این پژوهش اجرای تحلیل برگشتی تونل یادشده با استفاده از مدلهای ع...
متن کاملارائه راه کاری برای افزایش کارایی در خوشه بندی داده ها با استفاده از فازی نوع ?
تحلیل داده ها زمینه مناسبی را برای بسیاری از کاربرد های محاسباتی فراهم آورده است. تحلیل خوشه بندی، سازمان دهی مجموعه ای از نمونه ها بر اساس شباهت میان آنها درون گروه های مجزا می باشد. نمونه های درون یک خوشه نسبت به نمونه های دیگر خوشه ها بسیار مشابه یکدیگر هستند. یک الگوریتم خوشه بندی سخت، هر نمونه را فقط به یک خوشه نسبت می دهد، در حالی که خوشه بندی فازی هر نمونه را با درجات عضویت متفاوت درون چ...
بررسی راه های عملی تقویت وجدان کاری
برای بحث پیرامون این مقوله ابتدا به تعریف «وجدان» و معنای آن در فارسی و عربی و همین طور لاتین (انگلیسی) که زبان علمی مدیریت است می پردازیم و سپس وجدان کار در مدیریت اسلامی (یا جهان بینی الهی) و چگونگی تقویت آن و بعد وجدان کار (Responsiblity) در مدیریت علمی (جهان بینی مادی) مورد بررسی و سپس وجدان کار و مسؤولیت پذیری را از دیدگاه نویسنده و جمعی اساتید دانشگاه های کشور از طریق یک روش تحقیق تجربی (...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023