دسته بندی داده های چند برچسبی با استفاده از سامانه های دسته بندی یادگیرنده
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
- نویسنده سید کاوه احمدی ابهری
- استاد راهنما ستار هاشمی علی حمزه اقبال منصوری شهرام جعفری
- سال انتشار 1391
چکیده
دسته بندی یکی از مهمترین فرآیندهای مورد مطالعه در حوزه یادگیری ماشین و داده کاوی است که در برنامه های کاربردی فراوانی از جمله دسته بندی متن، تشخیص پزشکی، بیوانفورماتیک و... مورد استفاده قرار می گیرد. مسائل دسته بندی را می توان براساس تعداد برچسب های منتسب به هر یک از داده ها به دو دسته کلی مسائل دسته بندی تک برچسبی و مسائل دسته بندی چند برچسبی تقسیم کرد. در مسائل دسته بندی تک برچسبی، هر داده دارای یک برچسب منحصر به فرد است. اکثر مطالعات صورت گرفته در حوزه یادگیری ماشین مربوط به این نوع مسائل دسته بندی بوده است. اما مسائل مهم زیادی وجود دارد که حل آنها مستلزم انجام دسته بندی چند برچسبی است. در این مسائل، هر داده ممکن است به بیش از یک برچسب منتسب شود. سامانه های دسته بندی یادگیرنده (lcs) یک اسلوب ایجاد و استنتاج قوانین هستند که از الگوریتم ژنتیک به عنوان ساز و کار اولیه جستجو استفاده می کنند. این اسلوب ها به دنبال یک مجموعه از قوانین قابل اطمینان و با درجه صحت بالا هستند. اگرچه فعالیت های مختلفی برای انجام دسته بندی توسط سامانه های دسته بندی یادگیرنده انجام شده است اما اکثر این فعالیت ها نیز برای دسته بندی داده های تک برچسبی بوده و در مورد دسته بندی چند برچسبی این تحقیقات در اول راه قرار دارد. هدف اصلی این تحقیق، ایجاد یک مجموعه قوانین با استفاده از lcs برای دسته بندی داده های چند برچسبی است که نتایجی کارآمد و قابل مقایسه با سایر روش های دسته بندی چند برچسبی داشته باشد. در این تحقیق از xcs به عنوان سامانه پایه استفاده شده و بخش های عمده آن برای ایجاد امکان مواجهه با داده های چند برچسبی مورد تغییر قرار گرفته است. برای این منظور دو روش مختلف بازنمایی دانش برای مسائل دسته بندی چند برچسبی، روش پاداش دهی متناسب با این مسائل و یک ساز و کار کشف قوانین که با استفاده از یک مکانیزم رای گیری برای lcs و با بهره گیری از تجربیات قبلی سامانه ی کشف را هدایت می کند معرفی شده است.
منابع مشابه
ارزیابی رفتار دینامیکی خاک های ریزدانه با استفاده از الگوریتم دسته بندی گروهی داده ها
با توجه به اینکه عملکرد صحیح تأسیسات زیربنایی نیاز به طراحی دقیق دارد، بنابراین ارزیابی دقیق پارامترهای کلیدی با به کارگیری روش های نوین از اهمیت ویژه ای برخوردار است. در سازه های خاکی و سیستم های حمل و نقل، به عنوان بخشی از مهم ترین ابنیه ی فنی و زیرساخت ها که خدماتی ضروری برای بشر فراهم می نمایند، همواره برآورد و پیشبینی دقیق تر رفتار خاک، بخصوص در برابر بارهای دینامیکی، بسیار اهمی...
متن کاملارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
متن کاملدسته بندی پرسش ها با استفاده از ترکیب دسته بندها
هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...
متن کاملپیشگویی پیوند در شبکه های اجتماعی با استفاده از ترکیب دسته بندی کننده ها
Abstract Link prediction in social networks is one of the most important activities in analysis of such networks. The importance of link prediction in social networks is due to its dynamic nature. While members and their relationships (links) in such networks are continuously increasing, links may be missed due to various reasons. By predicting such links, the possibility of extension, compl...
متن کاملارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
متن کاملارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023