نتایج جستجو برای: مجموعه داده نامتوازن

تعداد نتایج: 229681  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی 1394

یکی از مسائل مهم در زمینه داده کاوی، مسأله دسته بندی مجموعه داده های نامتوازن است. اصطلاح «مجموعه داده نامتوازن»، عموما به مجموعه داده ای گفته می شود که تعداد نمونه ها در کلاس های گوناگون، اختلاف بسیاری داشته باشند. در این نوع داده ها، به کلاس هایی که کم ترین تعداد نمونه ها را دارند، کلاس اقلیت گفته می شود. به دلیل این که اکثر الگوریتم های یادگیری، یک دسته بند را با فرض برابر بودن تعداد نمونه ه...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1392

پردازش مجموعه داده های نامتوازن در بسیاری از کاربردهای دنیای واقعی، گسترده شده اند. این مسئله زمانی به وقوع می پیوندد که تعداد نمونه های یک یا چندین کلاس موجود در مجموعه داده، نسبت به تعداد نمونه های سایر کلاس ها کمتر باشند. این مشکل به وجود چولگی و عدم توازن در توزیع مجموعه داده ای مربوط شده و باعث ایجاد مشکلات برای بسیاری الگوریتم های معمول یادگیری ماشین می شود. در حقیقت، هدف اصلی یادگیری، به...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده ریاضی و کامپیوتر 1390

قه بندی چند برچسبی گسترش یافته روش های طبقه بندی سنتی است. که در آن هر نمونه می تواند به مجموعه ای از برچسب ها متعلق باشد. مثال هایی از داده های چند برچسبی در کاربرد های واقعی بسیار زیاد است که خود بیانگر اهمیت آن می باشد. به عنوان مثال یک فیلم می تواند به طور هم زمان هم به عنوان جنگی، هم جنایی و هم هیجان انگیز برچسب بخورد. از سوی دیگر مشاهده می شود که اکثر مجموعه های داده ای، در دنیای واقعی به...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز 1390

در ابتدا، دلایل ظهور و رایج شدن داده کاوی به عنوان یکی از مهم ترین گام های کشف دانش در پایگاه داده ها مورد توجه قرار می گیرد. مطالعه موردی ما یعنی دسته بندی گاوها به لحاظ سختی یا سهولت زایش و پیش بینی در این زمینه، یک کاربرد نوین از داده کاوی به شمار می آید که به تشریح و بیان ضرورت انجام آن، خواهیم پرداخت. پس از آن به پیشینه تاریخی داده کاوی، برخی کاربردها، توصیف فرایند kdd، دسته بندی عملکردها ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه سیستان و بلوچستان - دانشکده ریاضی 1392

بیماری های قلبی و عروقی سالانه موجب مرگ و میر صدها هزار نفر از انسان ها در سراسر دنیا می شوند. البته درصد ابتلای افراد به این بیماری در نقاط مختلف دنیا متفاوت می باشد. این موضوع موجب عدم توازن بین رکوردهای موجود از افراد سالم و دارای بیماری قلبی در مجموعه داده های موجود به منظور تشخیص این بیماری می شود. این عدم توازن موجب کاهش دقت برخی از روش های داده کاوی در تشخیص این نوع بیماران می گردد. هدف...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده برق و کامپیوتر 1392

طبقه بندی عملی مهم در داده کاوی و کشف دانش از پایگاه داده است. در اغلب موارد، زمانی که تلاش می کنیم تا یک طبقه بند را از داده های آموزشی یاد بگیریم، داده های آموزشی توزیع کلاس نامتوازنی دارند. مسألهی طبقه‏بندی نامتوازنِ باینری بدین صورت تعریف می شود: یک مسأله ی طبقه‏بندی است که در آن تفاوت قابل توجهی میان میزان نمونه‏های دو کلاس‎ وجود دارد. اغلب الگوریتم های یادگیری ماشین فرض می کنند که تعداد ن...

ژورنال: :پردازش علائم و داده ها 0
محبوبه مهدی زاده mahboubeh mahdizadeh mashhad- hashemi nejad avenue,no. 386مشهد - خیابان شهید هاشمی نژاد - پلاک 386 مهدی افتخاری mahdi eftekhari kermanکرمان

در زمینه مسائل طبقه بندی، اغلب با کلاس هایی مواجه می شویم که تعداد نمونه های متفاوتی دارند یعنی کلاس هایی با تعداد نمونه زیاد و کلاس هایی با تعداد نمونه ی کم؛ این مسائل «مسائل طبقه بندی با مجموعه داده های نامتوازن» نامیده می شوند. سیستم های طبقه بندی مبتنی بر قوانین فازی(frbcss) یکی از رایج ترین سیستم های مدلسازی فازیِ استفاده شده، برای حل مسائل طبقه بندی می باشند. وزن دهیِ قوانین اغلب برای بهبود...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی (نوشیروانی) بابل - دانشکده برق و کامپیوتر 1394

در سال های اخیر‏، جریان داده ها‏، توجه بسیاری از محققان را در حوزه های مختلف‎ ‎‎به خود جلب کرده است. از نظر هر سامانه، جریان داده ها، داده هایی با حجم بسیار بالا می باشند که به صورت افزایشی و با نرخ بالا به آن سامانه وارد می شوند. به دلیل حجم بسیار بالای این نوع داده ها، ذخیره سازی آن ها امری مقرون به صرفه نیست.‎‎‎از مهم ترین چالش های موجود در یادگیری جریان داده ها، تغییر الگوی توزیع داده ها در...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر 1391

دسته بندی داده ها یکی از موضوعات اساسی در داده کاوی است که کاربردهای مهم و حیاتی در مسایل دنیای واقعی مانند تشخیص بیماری، مدیریت ریسک و پیش بینی رفتارهای آتی دارد. روشهای عملی برای کار با داده های دنیای واقعی، درگیر مسایلی چون حجم زیاد داده ها، اطلاعات غیر-مفید یا نامناسب، تاثیرات نویز و عدم توازن می باشند. داده های جمع آوری شده، معمولاً دارای یک سری نمونه با ویژگی های مختلف براساس زمینه کاربرد...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی 1391

یکی از چالش های علمی امروز رویارویی با مجموعه داده های نامتوازن است. در این مجموعه داده ها، یکی از کلاس ها تعداد نمونه های بسیار کمتری نسبت به سایرین دارد(کلاس حداقلی) و همچنین از اهمیت بیشتری برخوردار است. تعلق تعداد زیادی از نمونه ها به یک کلاس(کلاس حداکثری) روند رده بندی با روش های معمول رده بندی را با مشکل مواجه می-کند. روش های معمول رده بندی، داده ها را به کلاس حداکثری منتسب می کنند از این...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید