بهبود کلاس بندی داده های نامتوازن با استفاده از الگوریتم های یادگیری ماشین
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی
- نویسنده عارف طهماسب
- استاد راهنما علی اکبر نیک نفس حمید میروزیری
- سال انتشار 1393
چکیده
در دنیای امروز مسئله کلاس بندی داده های نا متوازن از اهمیت خاصی برخوردار است . کلاس بندی این داده ها به گونه ای است که ، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد (کلاس اقلیت ) شامل تعداد حالات کمتری نسبت به کلاسی است که از اهمیت خاصی برخوردار نیست (کلاس اکثریت). به این مجموعه داده ها داده های نامتوازن می گویند. روش های مختلفی برای کلاس بندی این نوع داده ها ارائه شده است .در کلاس بندی این داده ها می کوشیم تا تعداد حالات کلاس اقلیت را نسبت به کلاس اکثریت افزایش دهیم .در این تحقیق به بررسی رویکرد های مختلف برای بهبود مسئله دسته بندی داده های نامتوازن با استفاده از الگوریتم های یادگیری ماشین پرداخته شده است. برای بهبود این مسئله به بررسی سه رویکرد اساسی در سطح داده ها ، الگوریتم ها و هزینه ها(ترکیب سطح داده ها و الگوریتم ها) پرداخته شده است. در این سه سطح از الگوریتم های تکاملی ، یادگیری ماشین و نمونه برداری و... استفاده شده و همچنین در این تحقیق یک روش جدید نمونه برداری برپایه الگوریتم رقابت استعماری و الگوریتم افزایش نمونه ها توسط نمونه های مصنوعی پیشنهاد گردیده است. در روش پیشنهادی از الگوریتم smote و الگوریتم رقابت استعماری برای نمونه برداری در دو سطح داده ها و الگوریتم ها استفاده شده است. به نوعی ترکیبی از دو سطح می باشد .این روش بر روی ده مجموعه داده پیاده سازی گردیده است . نتایج نشان می دهد که روش پیشنهادی با استفاده از الگوریتم های کلاس بندی درخت تصمیم و شبکه عصبی می تواند یک رویکرد مفید و موثر در حل مشکل دسته بندی داده های نامتوازن باشد . به نوعی خطای دسته بندی کلاس اقلیت را کاهش می دهند و دسته بندی آنها با دقت بالاتری انجام می شود.
منابع مشابه
دسته بندی مجموعه داده های نامتوازن با استفاده از روش های یادگیری ماشین
یکی از مسائل مهم در زمینه داده کاوی، مسأله دسته بندی مجموعه داده های نامتوازن است. اصطلاح «مجموعه داده نامتوازن»، عموما به مجموعه داده ای گفته می شود که تعداد نمونه ها در کلاس های گوناگون، اختلاف بسیاری داشته باشند. در این نوع داده ها، به کلاس هایی که کم ترین تعداد نمونه ها را دارند، کلاس اقلیت گفته می شود. به دلیل این که اکثر الگوریتم های یادگیری، یک دسته بند را با فرض برابر بودن تعداد نمونه ه...
بهبود الگوریتم های طبقه بندی مجموعه داده های نامتوازن با استفاده از روش های فازی و الگوریتم های تکاملی
طبقه بندی عملی مهم در داده کاوی و کشف دانش از پایگاه داده است. در اغلب موارد، زمانی که تلاش می کنیم تا یک طبقه بند را از داده های آموزشی یاد بگیریم، داده های آموزشی توزیع کلاس نامتوازنی دارند. مسألهی طبقهبندی نامتوازنِ باینری بدین صورت تعریف می شود: یک مسأله ی طبقهبندی است که در آن تفاوت قابل توجهی میان میزان نمونههای دو کلاس وجود دارد. اغلب الگوریتم های یادگیری ماشین فرض می کنند که تعداد ن...
بهبود طبقه بندی داده های نامتوازن
یکی از حوزه های مهم در داده کاوی طراحی الگوریتم های کلاس بندی با دقت بالا است. این امر به ویژه در شرایطی که داده ها دارای پراکندگی نامتوازن باشند، پیچیدگی بیشتری پیدا می کند. یادگیری کلاس نامتوازن به یادگیری از مجموعه داده های نامتوازن اشاره دارد که در آن تعداد نمونه های کلاس گروه اقلیت به طور قابل توجه ای کمتر از نمونه های کلاس گروه اکثریت است. به توجه به اینکه اکثر الگوریتم های یادگیری، طبقه ...
بهبود الگوریتم های تکاملی با استفاده از یادگیری ماشین
یادگیری ماشین یکی از شاخه های هوش مصنوعی می باشد که دامنهی تحقیقاتی وسیعی دارد. در مقالات مربوط به الگوریتم های تکاملی و روش های یادگیری ماشین، برخی از الگوریتم های تکاملی به عنوان نوعی از روشهای یادگیری ماشین استفاده شده است. با توجه به اینکه همواره الگوریتم های تکاملی به عنوان یادگیری ماشین به کار رفته است، ما در این پایان نامه به استفاده از روشهای یادگیری ماشین در بهبود الگوریتمهای تکاملی پر...
15 صفحه اولدسته بندی سبک های یادگیری با استفاده از ویژگی های رفتاری و ماشین بردار پشتیبان دو قلو
موفقیت تحصیلی دانشجویان از اهداف مهم در محیطهای آموزشی است. یکی از عوامل مهم در تحقق این هدف، توجه به سبک یادگیری دانشجویان است. آگاهی از سبک یادگیری دانشجویان به طراحی یک روش مناسب آموزش کمک میکند. لحاظ کردن یک شیوه مناسب آموزش باعث بهبود عملکرد دانشجویان در محیط آموزشی میشود. در این مقاله، هدف ساخت یک مدل برای تشخیص خودکار سبکهای یادگیری است. بدین منظور از یک محیط آموزش الکترونیکی متشکل ا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده فنی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023