دسته بندی داده های با حجم بالا با استفاده از روش های دسته بندی ترکیبی

پایان نامه
چکیده

بسیاری از روش های طبقه بندی ترکیبی به دلیل استفاده از چندین طبقه بند پایه، که بعضا شامل طبقه بند پایه کند هستند، در مواجهه با مجموعه داده های بزرگ پیچیدگی محاسباتی بالایی دارند. در این پژوهش روشی برای ترکیب نتایج طبقه بندها پیشنهاد شده است که با استفاده از خوشه بندی بخشی از مجموعه داده ی آموزش، علاوه بر کاهش پیچیدگی محاسباتی طبقه بندی ترکیبی دقت قابل قبولی را نیز ارائه دهد. در این روش ابتدا طبقه بندهای پایه بوسیله ی بخشی از مجموعه داده ورودی آموزش داده می شوند و سپس با استفاده از برچسب تعیین شده توسط طبقه بندهای پایه برای بخش دیگری از مجموعه داده ورودی، خوشه ها ایجاد می شوند. درنهایت نمونه های موجود در خوشه ها، خوشه ای که هر نمونه به آن تعلق دارد به همراه فاصله هر نمونه تا مرکز تمام خوشه ها به عنوان ورودی به یک شبکه عصبی مصنوعی داده می شوند و برچسب کلاس نهایی داده تست توسط این شبکه عصبی تعیین می شود. مقایسه کارایی روش پیشنهادی با چند روش طبقه بندی ترکیبی دیگر نشان می دهد که روش پیشنهادی زمان اجرای فاز تست کمتری نسبت به سایر روش ها دارد و همچنین در مجموع دقت قابل قبولی را ارائه داد.

منابع مشابه

دسته بندی اهداف سوناری با استفاده از روش ترکیبی ازدحام ذرات و جستجوی گرانشی

با توجه به خصوصیات فیزیکی بسیار نزدیک اهداف واقعی و کلاترِ سونار فعال، تفکیک این اهداف، از موضوعات چالش‌برانگیز محققان و صنعت‌گران حوزه آکوستیک می‌باشد. شبکه‌های عصبی چندلایه (MLP) یکی از پرکاربردترین شبکه‌های عصبی در دسته‌بندی اهداف دنیای واقعی هستند. آموزش از مهمترین بخش‌های توسعه این نوع شبکه ها است که در سال‌های اخیر بسیار مورد توجه قرار گرفته است. به منظور آموزش شبکه‌های MLP از دیر باز استف...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

ارزیابی رفتار دینامیکی خاک ‏های ریزدانه با استفاده از الگوریتم دسته ‏بندی گروهی داده‏ ها

با توجه به اینکه عملکرد صحیح تأسیسات زیربنایی نیاز به طراحی دقیق دارد، بنابراین ارزیابی دقیق پارامترهای کلیدی با به ‏کارگیری روش­ های نوین از اهمیت ویژه­ ای برخوردار است. در سازه ­های خاکی و سیستم ­های حمل و نقل، به ­عنوان بخشی از مهم ترین ابنیه ­ی فنی و زیرساخت­ ها که خدماتی ضروری برای بشر فراهم می ­نمایند، همواره برآورد و پیش­بینی دقیق ­تر رفتار خاک، بخصوص در برابر بارهای دینامیکی، بسیار اهمی...

متن کامل

دسته بندی پرسش ها با استفاده از ترکیب دسته بندها

هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023