بهبود کلاس بندی داده های نامتوازن با استفاده از الگوریتم های یادگیری ماشین

پایان نامه
چکیده

در دنیای امروز مسئله کلاس بندی داده های نا متوازن از اهمیت خاصی برخوردار است . کلاس بندی این داده ها به گونه ای است که ، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد (کلاس اقلیت ) شامل تعداد حالات کمتری نسبت به کلاسی است که از اهمیت خاصی برخوردار نیست (کلاس اکثریت). به این مجموعه داده ها داده های نامتوازن می گویند. روش های مختلفی برای کلاس بندی این نوع داده ها ارائه شده است .در کلاس بندی این داده ها می کوشیم تا تعداد حالات کلاس اقلیت را نسبت به کلاس اکثریت افزایش دهیم .در این تحقیق به بررسی رویکرد های مختلف برای بهبود مسئله دسته بندی داده های نامتوازن با استفاده از الگوریتم های یادگیری ماشین پرداخته شده است. برای بهبود این مسئله به بررسی سه رویکرد اساسی در سطح داده ها ، الگوریتم ها و هزینه ها(ترکیب سطح داده ها و الگوریتم ها) پرداخته شده است. در این سه سطح از الگوریتم های تکاملی ، یادگیری ماشین و نمونه برداری و... استفاده شده و همچنین در این تحقیق یک روش جدید نمونه برداری برپایه الگوریتم رقابت استعماری و الگوریتم افزایش نمونه ها توسط نمونه های مصنوعی پیشنهاد گردیده است. در روش پیشنهادی از الگوریتم smote و الگوریتم رقابت استعماری برای نمونه برداری در دو سطح داده ها و الگوریتم ها استفاده شده است. به نوعی ترکیبی از دو سطح می باشد .این روش بر روی ده مجموعه داده پیاده سازی گردیده است . نتایج نشان می دهد که روش پیشنهادی با استفاده از الگوریتم های کلاس بندی درخت تصمیم و شبکه عصبی می تواند یک رویکرد مفید و موثر در حل مشکل دسته بندی داده های نامتوازن باشد . به نوعی خطای دسته بندی کلاس اقلیت را کاهش می دهند و دسته بندی آنها با دقت بالاتری انجام می شود.

منابع مشابه

دسته بندی مجموعه داده های نامتوازن با استفاده از روش های یادگیری ماشین

یکی از مسائل مهم در زمینه داده کاوی، مسأله دسته بندی مجموعه داده های نامتوازن است. اصطلاح «مجموعه داده نامتوازن»، عموما به مجموعه داده ای گفته می شود که تعداد نمونه ها در کلاس های گوناگون، اختلاف بسیاری داشته باشند. در این نوع داده ها، به کلاس هایی که کم ترین تعداد نمونه ها را دارند، کلاس اقلیت گفته می شود. به دلیل این که اکثر الگوریتم های یادگیری، یک دسته بند را با فرض برابر بودن تعداد نمونه ه...

بهبود الگوریتم های طبقه بندی مجموعه داده های نامتوازن با استفاده از روش های فازی و الگوریتم های تکاملی

طبقه بندی عملی مهم در داده کاوی و کشف دانش از پایگاه داده است. در اغلب موارد، زمانی که تلاش می کنیم تا یک طبقه بند را از داده های آموزشی یاد بگیریم، داده های آموزشی توزیع کلاس نامتوازنی دارند. مسألهی طبقه‏بندی نامتوازنِ باینری بدین صورت تعریف می شود: یک مسأله ی طبقه‏بندی است که در آن تفاوت قابل توجهی میان میزان نمونه‏های دو کلاس‎ وجود دارد. اغلب الگوریتم های یادگیری ماشین فرض می کنند که تعداد ن...

بهبود طبقه بندی داده های نامتوازن

یکی از حوزه های مهم در داده کاوی طراحی الگوریتم های کلاس بندی با دقت بالا است. این امر به ویژه در شرایطی که داده ها دارای پراکندگی نامتوازن باشند، پیچیدگی بیشتری پیدا می کند. یادگیری کلاس نامتوازن به یادگیری از مجموعه داده های نامتوازن اشاره دارد که در آن تعداد نمونه های کلاس گروه اقلیت به طور قابل توجه ای کمتر از نمونه های کلاس گروه اکثریت است. به توجه به اینکه اکثر الگوریتم های یادگیری، طبقه ...

بهبود الگوریتم های تکاملی با استفاده از یادگیری ماشین

یادگیری ماشین یکی از شاخه های هوش مصنوعی می باشد که دامنهی تحقیقاتی وسیعی دارد. در مقالات مربوط به الگوریتم های تکاملی و روش های یادگیری ماشین، برخی از الگوریتم های تکاملی به عنوان نوعی از روشهای یادگیری ماشین استفاده شده است. با توجه به اینکه همواره الگوریتم های تکاملی به عنوان یادگیری ماشین به کار رفته است، ما در این پایان نامه به استفاده از روشهای یادگیری ماشین در بهبود الگوریتمهای تکاملی پر...

15 صفحه اول

دسته بندی سبک های یادگیری با استفاده از ویژگی های رفتاری و ماشین بردار پشتیبان دو قلو

موفقیت تحصیلی دانشجویان از اهداف مهم در محیط‌های آموزشی است. یکی از عوامل مهم در تحقق این هدف، توجه به سبک یادگیری دانشجویان است. آگاهی از سبک یادگیری دانشجویان به طراحی یک روش مناسب آموزش کمک می‌کند. لحاظ کردن یک شیوه مناسب آموزش باعث بهبود عملکرد دانشجویان در محیط آموزشی می‌شود. در این مقاله، هدف ساخت یک مدل برای تشخیص خودکار سبک‌های یادگیری است. بدین منظور از یک محیط آموزش الکترونیکی متشکل ا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023