نتایج جستجو برای: داده نامتوازن

تعداد نتایج: 213027  

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی (نوشیروانی) بابل - دانشکده برق و کامپیوتر 1394

در سال های اخیر‏، جریان داده ها‏، توجه بسیاری از محققان را در حوزه های مختلف‎ ‎‎به خود جلب کرده است. از نظر هر سامانه، جریان داده ها، داده هایی با حجم بسیار بالا می باشند که به صورت افزایشی و با نرخ بالا به آن سامانه وارد می شوند. به دلیل حجم بسیار بالای این نوع داده ها، ذخیره سازی آن ها امری مقرون به صرفه نیست.‎‎‎از مهم ترین چالش های موجود در یادگیری جریان داده ها، تغییر الگوی توزیع داده ها در...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید چمران اهواز - دانشکده مهندسی 1394

یکی از مسائل مهم در زمینه داده کاوی، مسأله دسته بندی مجموعه داده های نامتوازن است. اصطلاح «مجموعه داده نامتوازن»، عموما به مجموعه داده ای گفته می شود که تعداد نمونه ها در کلاس های گوناگون، اختلاف بسیاری داشته باشند. در این نوع داده ها، به کلاس هایی که کم ترین تعداد نمونه ها را دارند، کلاس اقلیت گفته می شود. به دلیل این که اکثر الگوریتم های یادگیری، یک دسته بند را با فرض برابر بودن تعداد نمونه ه...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1392

پردازش مجموعه داده های نامتوازن در بسیاری از کاربردهای دنیای واقعی، گسترده شده اند. این مسئله زمانی به وقوع می پیوندد که تعداد نمونه های یک یا چندین کلاس موجود در مجموعه داده، نسبت به تعداد نمونه های سایر کلاس ها کمتر باشند. این مشکل به وجود چولگی و عدم توازن در توزیع مجموعه داده ای مربوط شده و باعث ایجاد مشکلات برای بسیاری الگوریتم های معمول یادگیری ماشین می شود. در حقیقت، هدف اصلی یادگیری، به...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده ریاضی و کامپیوتر 1390

قه بندی چند برچسبی گسترش یافته روش های طبقه بندی سنتی است. که در آن هر نمونه می تواند به مجموعه ای از برچسب ها متعلق باشد. مثال هایی از داده های چند برچسبی در کاربرد های واقعی بسیار زیاد است که خود بیانگر اهمیت آن می باشد. به عنوان مثال یک فیلم می تواند به طور هم زمان هم به عنوان جنگی، هم جنایی و هم هیجان انگیز برچسب بخورد. از سوی دیگر مشاهده می شود که اکثر مجموعه های داده ای، در دنیای واقعی به...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی مهندسی 1390

سرطان، یکی از دلایل اصلی مرگ در سراسر جهان است. در این بیماری، سلول های بدن به صورت غیر قابل کنترل رشد می کنند. گروهی از سلول هایی که به سرعت تکثیر شده اند، ممکن است یک توده، جرم یا بافت اضافی ایجاد کنند. این توده ها، تومور نامیده می شوند. توده ها می توانند سرطانی یا غیرسرطانی باشند. سرطان سینه، دومین عامل مرگ زنان است. این بیماری در میان مردان و زنان دیده شده، گرچه موارد ابتلا در میان مردان نا...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز 1390

در ابتدا، دلایل ظهور و رایج شدن داده کاوی به عنوان یکی از مهم ترین گام های کشف دانش در پایگاه داده ها مورد توجه قرار می گیرد. مطالعه موردی ما یعنی دسته بندی گاوها به لحاظ سختی یا سهولت زایش و پیش بینی در این زمینه، یک کاربرد نوین از داده کاوی به شمار می آید که به تشریح و بیان ضرورت انجام آن، خواهیم پرداخت. پس از آن به پیشینه تاریخی داده کاوی، برخی کاربردها، توصیف فرایند kdd، دسته بندی عملکردها ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی صنعتی کرمان - دانشکده برق و کامپیوتر 1393

یکی از حوزه های مهم در داده کاوی طراحی الگوریتم های کلاس بندی با دقت بالا است. این امر به ویژه در شرایطی که داده ها دارای پراکندگی نامتوازن باشند، پیچیدگی بیشتری پیدا می کند. یادگیری کلاس نامتوازن به یادگیری از مجموعه داده های نامتوازن اشاره دارد که در آن تعداد نمونه های کلاس گروه اقلیت به طور قابل توجه ای کمتر از نمونه های کلاس گروه اکثریت است. به توجه به اینکه اکثر الگوریتم های یادگیری، طبقه ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه سیستان و بلوچستان - دانشکده مدیریت و حسابداری 1391

هدف از این پژوهش بررسی تاثیر رتبه اعتباری بر قیمت گذاری سهام عرضه های عمومی اولیه در بورس اوراق بهادار تهران است. به این منظور از شیوه ی تحلیل پوششی داده ها استفاده شد تا به وسیله آن کارایی اعتباری نسبی شرکت های مورد مطالعه محاسبه و رتبه اعتباری آنها تعیین شود. نمونه آماری تحقیق شامل 52 شرکت می باشد. شواهد حاصل از عرضه های عمومی اولیه در طی سال های 1388-1382 حاکی از آن است که رتبه بندی اعتباری ...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه سیستان و بلوچستان - دانشکده ریاضی 1392

بیماری های قلبی و عروقی سالانه موجب مرگ و میر صدها هزار نفر از انسان ها در سراسر دنیا می شوند. البته درصد ابتلای افراد به این بیماری در نقاط مختلف دنیا متفاوت می باشد. این موضوع موجب عدم توازن بین رکوردهای موجود از افراد سالم و دارای بیماری قلبی در مجموعه داده های موجود به منظور تشخیص این بیماری می شود. این عدم توازن موجب کاهش دقت برخی از روش های داده کاوی در تشخیص این نوع بیماران می گردد. هدف...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده برق و کامپیوتر 1392

طبقه بندی عملی مهم در داده کاوی و کشف دانش از پایگاه داده است. در اغلب موارد، زمانی که تلاش می کنیم تا یک طبقه بند را از داده های آموزشی یاد بگیریم، داده های آموزشی توزیع کلاس نامتوازنی دارند. مسألهی طبقه‏بندی نامتوازنِ باینری بدین صورت تعریف می شود: یک مسأله ی طبقه‏بندی است که در آن تفاوت قابل توجهی میان میزان نمونه‏های دو کلاس‎ وجود دارد. اغلب الگوریتم های یادگیری ماشین فرض می کنند که تعداد ن...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید