نتایج جستجو برای: داده نامتوازن
تعداد نتایج: 213027 فیلتر نتایج به سال:
در سال های اخیر، جریان داده ها، توجه بسیاری از محققان را در حوزه های مختلف به خود جلب کرده است. از نظر هر سامانه، جریان داده ها، داده هایی با حجم بسیار بالا می باشند که به صورت افزایشی و با نرخ بالا به آن سامانه وارد می شوند. به دلیل حجم بسیار بالای این نوع داده ها، ذخیره سازی آن ها امری مقرون به صرفه نیست.از مهم ترین چالش های موجود در یادگیری جریان داده ها، تغییر الگوی توزیع داده ها در...
یکی از مسائل مهم در زمینه داده کاوی، مسأله دسته بندی مجموعه داده های نامتوازن است. اصطلاح «مجموعه داده نامتوازن»، عموما به مجموعه داده ای گفته می شود که تعداد نمونه ها در کلاس های گوناگون، اختلاف بسیاری داشته باشند. در این نوع داده ها، به کلاس هایی که کم ترین تعداد نمونه ها را دارند، کلاس اقلیت گفته می شود. به دلیل این که اکثر الگوریتم های یادگیری، یک دسته بند را با فرض برابر بودن تعداد نمونه ه...
پردازش مجموعه داده های نامتوازن در بسیاری از کاربردهای دنیای واقعی، گسترده شده اند. این مسئله زمانی به وقوع می پیوندد که تعداد نمونه های یک یا چندین کلاس موجود در مجموعه داده، نسبت به تعداد نمونه های سایر کلاس ها کمتر باشند. این مشکل به وجود چولگی و عدم توازن در توزیع مجموعه داده ای مربوط شده و باعث ایجاد مشکلات برای بسیاری الگوریتم های معمول یادگیری ماشین می شود. در حقیقت، هدف اصلی یادگیری، به...
قه بندی چند برچسبی گسترش یافته روش های طبقه بندی سنتی است. که در آن هر نمونه می تواند به مجموعه ای از برچسب ها متعلق باشد. مثال هایی از داده های چند برچسبی در کاربرد های واقعی بسیار زیاد است که خود بیانگر اهمیت آن می باشد. به عنوان مثال یک فیلم می تواند به طور هم زمان هم به عنوان جنگی، هم جنایی و هم هیجان انگیز برچسب بخورد. از سوی دیگر مشاهده می شود که اکثر مجموعه های داده ای، در دنیای واقعی به...
سرطان، یکی از دلایل اصلی مرگ در سراسر جهان است. در این بیماری، سلول های بدن به صورت غیر قابل کنترل رشد می کنند. گروهی از سلول هایی که به سرعت تکثیر شده اند، ممکن است یک توده، جرم یا بافت اضافی ایجاد کنند. این توده ها، تومور نامیده می شوند. توده ها می توانند سرطانی یا غیرسرطانی باشند. سرطان سینه، دومین عامل مرگ زنان است. این بیماری در میان مردان و زنان دیده شده، گرچه موارد ابتلا در میان مردان نا...
در ابتدا، دلایل ظهور و رایج شدن داده کاوی به عنوان یکی از مهم ترین گام های کشف دانش در پایگاه داده ها مورد توجه قرار می گیرد. مطالعه موردی ما یعنی دسته بندی گاوها به لحاظ سختی یا سهولت زایش و پیش بینی در این زمینه، یک کاربرد نوین از داده کاوی به شمار می آید که به تشریح و بیان ضرورت انجام آن، خواهیم پرداخت. پس از آن به پیشینه تاریخی داده کاوی، برخی کاربردها، توصیف فرایند kdd، دسته بندی عملکردها ...
یکی از حوزه های مهم در داده کاوی طراحی الگوریتم های کلاس بندی با دقت بالا است. این امر به ویژه در شرایطی که داده ها دارای پراکندگی نامتوازن باشند، پیچیدگی بیشتری پیدا می کند. یادگیری کلاس نامتوازن به یادگیری از مجموعه داده های نامتوازن اشاره دارد که در آن تعداد نمونه های کلاس گروه اقلیت به طور قابل توجه ای کمتر از نمونه های کلاس گروه اکثریت است. به توجه به اینکه اکثر الگوریتم های یادگیری، طبقه ...
هدف از این پژوهش بررسی تاثیر رتبه اعتباری بر قیمت گذاری سهام عرضه های عمومی اولیه در بورس اوراق بهادار تهران است. به این منظور از شیوه ی تحلیل پوششی داده ها استفاده شد تا به وسیله آن کارایی اعتباری نسبی شرکت های مورد مطالعه محاسبه و رتبه اعتباری آنها تعیین شود. نمونه آماری تحقیق شامل 52 شرکت می باشد. شواهد حاصل از عرضه های عمومی اولیه در طی سال های 1388-1382 حاکی از آن است که رتبه بندی اعتباری ...
بیماری های قلبی و عروقی سالانه موجب مرگ و میر صدها هزار نفر از انسان ها در سراسر دنیا می شوند. البته درصد ابتلای افراد به این بیماری در نقاط مختلف دنیا متفاوت می باشد. این موضوع موجب عدم توازن بین رکوردهای موجود از افراد سالم و دارای بیماری قلبی در مجموعه داده های موجود به منظور تشخیص این بیماری می شود. این عدم توازن موجب کاهش دقت برخی از روش های داده کاوی در تشخیص این نوع بیماران می گردد. هدف...
طبقه بندی عملی مهم در داده کاوی و کشف دانش از پایگاه داده است. در اغلب موارد، زمانی که تلاش می کنیم تا یک طبقه بند را از داده های آموزشی یاد بگیریم، داده های آموزشی توزیع کلاس نامتوازنی دارند. مسألهی طبقهبندی نامتوازنِ باینری بدین صورت تعریف می شود: یک مسأله ی طبقهبندی است که در آن تفاوت قابل توجهی میان میزان نمونههای دو کلاس وجود دارد. اغلب الگوریتم های یادگیری ماشین فرض می کنند که تعداد ن...
نمودار تعداد نتایج جستجو در هر سال
با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید