رده بندی مجموعه داده های نامتوازن با استفاده از تکنیک های داده کاوی

پایان نامه
چکیده

یکی از چالش های علمی امروز رویارویی با مجموعه داده های نامتوازن است. در این مجموعه داده ها، یکی از کلاس ها تعداد نمونه های بسیار کمتری نسبت به سایرین دارد(کلاس حداقلی) و همچنین از اهمیت بیشتری برخوردار است. تعلق تعداد زیادی از نمونه ها به یک کلاس(کلاس حداکثری) روند رده بندی با روش های معمول رده بندی را با مشکل مواجه می-کند. روش های معمول رده بندی، داده ها را به کلاس حداکثری منتسب می کنند از این رو صحت رده بندی بالا خواهد بود ولی قابل اعتماد نیست. در این تحقیق روش های ترکیبی جدیدی در سطح داده برای حل این مشکل معرفی خواهند شد. با کمک این روش ها توزیع نامتوازن داده ها، توازن یافته و اجرای رده بند ها بر روی آن ها عملکرد بهتری خواهند داشت. در این تحقیق روش های بیش نمونه برداری و زیرنمونه برداری ترکیب شده اند. روش های ترکیبی این تحقیق تأثیر بهتری نسبت به روش های دیگر دارند که با اجرای آن ها بر روی مجموعه داده ها و محاسبه معیار ارزیابی این امر نشان داده خواهد شد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

استفاده از تکنیک های داده کاوی جهت تشخیص دیابت با استفاده از چربی خون

مقدمه: بیماری دیابت یکی از شایع ترین، خطرناک ترین و پرهزینه ترین بیماری های حال حاضر دنیا است که با نرخ هشدار دهنده ای در حال افزایش است. استفاده از روش‌ های داده‌ کاوی می تواند به تشخیص زودهنگام دیابت کمک کند که باعث جلوگیری از پیشرفت این بیماری و خیلی از عوارض آن مانند بیماری قلب و عروق، مشکلات بینایی و بیماری های کلیوی می شود. مواد و روش ها: در این تحقیق از نرم افزار داده کاوی رپیدماینر برای...

متن کامل

بررسی میزان تأثیر داروهای درمان ناباروری در بیماران نابارور با استفاده از الگوریتم خوشه بندی و تکنیک های داده کاوی

Background and purpose: The rate of infertility has increased throughout the world. Data mining is a new method for analyzing information from databases. Few studies are done regarding infertility and using data mining in describing and predicting different treatment methods and factors influencing these methods. This paper proposes a model for evaluating the efficacy of different drugs in trea...

متن کامل

تحلیل داده‌های خرابی تجهیزات علائم در راه‌آهن ایران با استفاده از تکنیک های داده کاوی

حمل ایمن بار و مسافر برای مدیران حمل‌ونقل ریلی، از اهمیت بسیار بالایی برخوردار است. به‌کارگیری روش‌های ایمن حمل‌ونقل، نیازمند شناخت کامل از عوامل به وجود آورنده شرایط غیر ایمن است که این امر با یادگیری از تجربیات گذشته محقق می‌گردد. سیستم علائم و ارتباطات راه‌آهن یکی از بخش‌های بسیار مهمی است که کنترل خرابی قطعات و تجهیزات علائمی و ارتباطی و در نتیجه فراهم نمودن شرایط ایمن حرکت قطارها بخشی از و...

متن کامل

کاوش خصوصیات مشتریان بانکداری خرد با استفاده از تکنیک های داده کاوی

با روند خصوصی سازی در صنعت بانکداری کشور و رشد بی­سابقه رقابت در تکنولوژی­های بانکداری، هر روزه بر اهمیت نگهداری از مشتریان کنونی و جذب مشتریان جدید افزوده می­شود. نگهداری مشتریان یک استراتژی ارزشمند است که سودآوری بلند مدت و موفقیت سازمان­ها را تضمین می­کند. در این مطالعه، با استفاده از تکنیک­های داده کاوی مدلی دو مرحله­ای برای شناسایی ویژگی­های گروه­های مختلف مشتریان سپرده کوتاه مدت بانک معرف...

متن کامل

تعیین هوشمند اندازه بار در آزمون وینگیت با استفاده از تکنیک های داده کاوی

زمینه و هدف: آزمون وینگیت شامل 30 ثانیه تمرین فوق بیشینه روی یک دوچرخه کارسنج است که میزان بار اعمال شده براساس وزن فرد تعیین می شود. اندازه بار علاوه بر وزن آزمودنی به پارامترهایی از جمله سن و جنسیت نیز وابسته است. عاوه بر پارامترهای نامبرده شده، پارامتر هایی ازقبیل میزان سطح ورزشی، درصد چربی زیر پوستی و سطح مصرف دخانیات آزمودنی نیز در تعیین اندازه بار تاثیرگذار می باشند. هدف از پژوهش حاضر ارا...

متن کامل

کاوش پویایی مشتری در طراحی بخش بندی با استفاده از روش های داده کاوی

یکی از موضوعات مهم در مسئلۀ بخش­بندی پویای مشتریان، انتقال مشتریان به بخش­های مختلف در طول زمان و کشف الگوهای حاکم بر این جابه­جایی­ها است. بر این اساس، این مقاله بر پویایی مشتری تمرکز کرده و تلاش می‎کند، گروه­های رفتاری مشتریان و ویژگی­های غالب این گروه­ها و الگوهای کلی حاکم بر جابه­جایی و مهاجرت مشتریان به بخش­های مختلف را در طول زمان استخراج کند. برای این کار، روش ترکیبی جدیدی مبتنی بر الگور...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023