رده بندی مجموعه داده های نامتوازن با استفاده از تکنیک های داده کاوی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی
- نویسنده نسیمه صفاهیه
- استاد راهنما بهروز مینایی بیدگلی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
یکی از چالش های علمی امروز رویارویی با مجموعه داده های نامتوازن است. در این مجموعه داده ها، یکی از کلاس ها تعداد نمونه های بسیار کمتری نسبت به سایرین دارد(کلاس حداقلی) و همچنین از اهمیت بیشتری برخوردار است. تعلق تعداد زیادی از نمونه ها به یک کلاس(کلاس حداکثری) روند رده بندی با روش های معمول رده بندی را با مشکل مواجه می-کند. روش های معمول رده بندی، داده ها را به کلاس حداکثری منتسب می کنند از این رو صحت رده بندی بالا خواهد بود ولی قابل اعتماد نیست. در این تحقیق روش های ترکیبی جدیدی در سطح داده برای حل این مشکل معرفی خواهند شد. با کمک این روش ها توزیع نامتوازن داده ها، توازن یافته و اجرای رده بند ها بر روی آن ها عملکرد بهتری خواهند داشت. در این تحقیق روش های بیش نمونه برداری و زیرنمونه برداری ترکیب شده اند. روش های ترکیبی این تحقیق تأثیر بهتری نسبت به روش های دیگر دارند که با اجرای آن ها بر روی مجموعه داده ها و محاسبه معیار ارزیابی این امر نشان داده خواهد شد.
منابع مشابه
استفاده از تکنیک های داده کاوی جهت تشخیص دیابت با استفاده از چربی خون
مقدمه: بیماری دیابت یکی از شایع ترین، خطرناک ترین و پرهزینه ترین بیماری های حال حاضر دنیا است که با نرخ هشدار دهنده ای در حال افزایش است. استفاده از روش های داده کاوی می تواند به تشخیص زودهنگام دیابت کمک کند که باعث جلوگیری از پیشرفت این بیماری و خیلی از عوارض آن مانند بیماری قلب و عروق، مشکلات بینایی و بیماری های کلیوی می شود. مواد و روش ها: در این تحقیق از نرم افزار داده کاوی رپیدماینر برای...
متن کاملبررسی میزان تأثیر داروهای درمان ناباروری در بیماران نابارور با استفاده از الگوریتم خوشه بندی و تکنیک های داده کاوی
Background and purpose: The rate of infertility has increased throughout the world. Data mining is a new method for analyzing information from databases. Few studies are done regarding infertility and using data mining in describing and predicting different treatment methods and factors influencing these methods. This paper proposes a model for evaluating the efficacy of different drugs in trea...
متن کاملتحلیل دادههای خرابی تجهیزات علائم در راهآهن ایران با استفاده از تکنیک های داده کاوی
حمل ایمن بار و مسافر برای مدیران حملونقل ریلی، از اهمیت بسیار بالایی برخوردار است. بهکارگیری روشهای ایمن حملونقل، نیازمند شناخت کامل از عوامل به وجود آورنده شرایط غیر ایمن است که این امر با یادگیری از تجربیات گذشته محقق میگردد. سیستم علائم و ارتباطات راهآهن یکی از بخشهای بسیار مهمی است که کنترل خرابی قطعات و تجهیزات علائمی و ارتباطی و در نتیجه فراهم نمودن شرایط ایمن حرکت قطارها بخشی از و...
متن کاملکاوش خصوصیات مشتریان بانکداری خرد با استفاده از تکنیک های داده کاوی
با روند خصوصی سازی در صنعت بانکداری کشور و رشد بیسابقه رقابت در تکنولوژیهای بانکداری، هر روزه بر اهمیت نگهداری از مشتریان کنونی و جذب مشتریان جدید افزوده میشود. نگهداری مشتریان یک استراتژی ارزشمند است که سودآوری بلند مدت و موفقیت سازمانها را تضمین میکند. در این مطالعه، با استفاده از تکنیکهای داده کاوی مدلی دو مرحلهای برای شناسایی ویژگیهای گروههای مختلف مشتریان سپرده کوتاه مدت بانک معرف...
متن کاملتعیین هوشمند اندازه بار در آزمون وینگیت با استفاده از تکنیک های داده کاوی
زمینه و هدف: آزمون وینگیت شامل 30 ثانیه تمرین فوق بیشینه روی یک دوچرخه کارسنج است که میزان بار اعمال شده براساس وزن فرد تعیین می شود. اندازه بار علاوه بر وزن آزمودنی به پارامترهایی از جمله سن و جنسیت نیز وابسته است. عاوه بر پارامترهای نامبرده شده، پارامتر هایی ازقبیل میزان سطح ورزشی، درصد چربی زیر پوستی و سطح مصرف دخانیات آزمودنی نیز در تعیین اندازه بار تاثیرگذار می باشند. هدف از پژوهش حاضر ارا...
متن کاملکاوش پویایی مشتری در طراحی بخش بندی با استفاده از روش های داده کاوی
یکی از موضوعات مهم در مسئلۀ بخشبندی پویای مشتریان، انتقال مشتریان به بخشهای مختلف در طول زمان و کشف الگوهای حاکم بر این جابهجاییها است. بر این اساس، این مقاله بر پویایی مشتری تمرکز کرده و تلاش میکند، گروههای رفتاری مشتریان و ویژگیهای غالب این گروهها و الگوهای کلی حاکم بر جابهجایی و مهاجرت مشتریان به بخشهای مختلف را در طول زمان استخراج کند. برای این کار، روش ترکیبی جدیدی مبتنی بر الگور...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023