طبقه بندی برخط داده های جریانی غیرایستان و نامتعادل با رویکرد وزن دهی

پایان نامه
چکیده

طبقه بندی داده های جریانی غیرایستان یکی از شاخه های مهم علم تشخیص الگو و یادگیری ماشین است که به طور روز افزون مورد توجه قرار گرفته است. دلیل این موضوع کاربردهای فراوان جدیدی از قبیل کارت های اعتباری، آب و هوا، شبکه های حس گر بی سیم، داده های وب و غیره است. در طبقه بندی داده های جریانی چالش اساسی تغییر مفهوم (غیرایستان بودن) است، که در آن تابع توزیع زیرین توصیف کننده داده ها به مرور زمان تغییر می کند. یکی از چالش های دیگری که در طبقه بندی داده های جریانی وجود دارد کلاس های نامتعادل است. کلاس های نامتعادل چالشی برای بیش تر طبقه بندهای باناظر است که در آن تعداد نمونه ها در کلاس های مختلف با یکدیگر اختلاف فاحش دارند. اغلب الگوریتم هایی که تاکنون برای طبقه بندی داده های جریانی غیرایستان و نامتعادل ارائه شده اند رویکرد دسته ای دارند. از این رو، برخلاف مطالعات قبلی، در این پایان نامه طبقه بندهایی برخط برای طبقه بندی داده های جریانی غیرایستان و نامتعادل پیشنهاد شده است. در این راستا، الگوریتم هایی در سه دسته اساسی مبتنی بر فیلترهای وفقی، پرسپترون و ترکیب برخط طبقه بندها ارائه شده است. در الگوریتم های مبتنی بر فیلتر وفقی و پرسپترون رویکرد اساسی وزن دهی به خطا و در الگوریتم های مبتنی بر ترکیب برخط طبقه بندها رویکرد اساسی وزن دهی به رأی طبقه بندهای پایه است. در الگوریتم های مبتنی بر فیلترهای وفقی از تئوری ردیابی و تئوری کالمن و در الگوریتم های مبتنی بر پرسپترون و ترکیب برخط طبقه بندها از مدل کران خطا برای تحلیل الگوریتم ها استفاده شده است. برای ارزیابی الگوریتم ها از مجموعه داده های متنوع واقعی و مصنوعی مورد استفاده در تحقیقات پیشین، بهره برده شده است. در ارزیابی الگوریتم ها از معیارهای میانگین هندسی، نرخ صحت مثبت و منفی (tpr,tnr)، f-measure و هم چنین مرتبه زمانی و مکانی استفاده شده است. برای تأیید نتایج آزمایش ها از آزمون های تمایز آماری anova و hsd استفاده شده است. نتایج آزمون های تمایز آماری نشان دهنده برتری الگوریتم های پیشنهادی مبتنی بر فیلترهای وفقی نسبت به rlsp,rbsop,lbsop,rbp,lbp، الگوریتم های پیشنهادی مبتنی بر پرسپترون نسبت به spa,sop,lbsop,rbsop و الگوریتم های پیشنهادی مبتنی بر ترکیب برخط طبقه بندها نسبت به oe1,oe2,onb دارد.

منابع مشابه

یک روش برای کاهش طبقه بندی داده با استفاده از تکنیک وزن دهی در svm+

svm یک الگوریتم یادگیری مرتبط به تجزیه و تحلیل داده ها و تشخیص الگوها مورد استفاده می باشد.اما مسئله مهمی که وجود دارد داده های تکراری و همچنین زمان پردازش واقعی آن بدرستی مورد محاسبه واقع نشده است. به همین دلیل ما یک روش برای کاهش طبقه بندی داده ها با استفاده از تکنیک وزن دهی در svm+ است را ارائه داده ایم. روش پیشنهادی که با درنظر گرفتن پارامترها نسبت به svm+ زمان پاسخگویی بهینه دارد.با مشاهده...

کاوش برخط الگوهای پویای زمانی در داده های جریانی

کاوش در جریان داده فرایندی است که منجر به استخراج دانش از جریانی سریع از داده های پیوسته می شود. در سالهای اخیر، به دلیل اهمیت کاربردهای آن و پیشرفت در تکنولوژی سخت افزاری بسیار مورد توجه قرار گرفته شده است. در بسیاری از زمینه های کاربردی مانند شبکه های کامپیوتری، بازارهای مالی و مبادلات ارزی، مکالمات تلفنی، کارت های اعتباری، مراکز داده و سرورها، تصاویر ویدئویی، شبکه حسگرها، رادارها، ماهواره ها...

15 صفحه اول

طبقه بندی راه های شهری مبتنی بر ادغام در سطح تصمیمات داده های نوری و راداری

در این مقاله قابلیت تصاویر اسپات و سار به منظور تشخیص عارضه راه در مناطق شهری مورد بررسی قرار گرفته است. شباهت طیفی عارضه راه با سقف آسفالت ساختمان ها در مناطق شهری موجب بروز مشکلاتی در تشخیص راه مبتنی بر داده های اپتیک از جمله اسپات می گردد. از سوی دیگر، تصاویر سار با اینکه قابلیت خوبی در تشخیص راههای فرعی و باریک دارند، اما در تشخیص راه از پوشش گیاهی دچار مشکلاتی می شود. بنابراین، نتایج حاصل ...

متن کامل

دسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها

در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...

متن کامل

ارائه یک سیستم طبقه بندی کننده چندگانه فازی برای ادغام داده های فراطیفی و لیدار

محدودیت­های سنجنده­های مختلف سنجش از دور و ضعف آنها در شناسایی عوارض مختلف باعث شد ادغام داده­های حاصل از سنجنده­های مختلف به منظور بهبود نتایج طبقه بندی مورد توجه قرار گیرد. در میان سنجنده­های مختلف کنونی، در سال­های اخیر دو سنجنده فراطیفی و لیدار به منظور طبقه­بندی زمین بسیار پرکاربرد بوده­اند. داده­های حاصل از لیدار اطلاعات ارتفاعی مناسبی را از عوارض زمینی به ویژه عوارض دارای ارتفاع مانند سا...

متن کامل

طبقه بندی متقاضیان تسهیلات اعتباری بانکی با استفاده از داده کاوی و منطق فازی

در این پژوهش، هدف، بهره گیری از ابزارهای داده کاوی و منطق فازی برایطبقه بندی مشتریان تسهیلات اعتباری می باشد به طوریکه ابهامات و عدم قطعیت رادر خصوص طبقات مشتریان و نیز متغیرهای تاثیر گذار در رفتار آنها را پوشش دهد.روش کار بدین شکل می باشد که طبق یک فرایند استاندارد داده کاوی، داده هایمشتریان سابق بانک سامان جمع آوری و پالایش شده و سپس طبقات و متغیرهاییکه قابلیت فازی کردن داشتند، طبق نظر کارشنا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023