طبقه بندی خطی داده های جداناپذیر خطی با مستثنی سازی قیود

پایان نامه
چکیده

معیارهای مختلفی برای ارزیابی طبقه بندها وجود دارد که از آن جمله می توان به صحت، دقت، سادگی، تعمیم پذیری، تفسیرپذیری، تعداد پارامترها و نحوه ی تنظیم آن ها اشاره نمود. طبقه بندهای خطی، ساده، تعمیم پذیر، تفسیرپذیر و دارای تعداد پارامتر کم هستند. اما اغلب مسائل طبقه بندی دنیای واقعی دارای الگوهای جداناپذیر خطی است. برای این که طبقه بند خطی بتواند داده های جداناپذیر خطی را نیز درست طبقه بندی کند، یک راه حل، تبدیل داده ها به کمک توابع کرنل و راه حل دیگر ترکیب طبقه بندهای ساده است. از جمله ی روش های ترکیب، می توان به طبقه بندهای خطی محلی و روش های boosting اشاره کرد. یکی از نکاتی که در ترکیب طبقه بندها باید رعایت شود این است که هر چقدر طبقه بندهای پایه ی تشکیل دهنده ی طبقه بند نهایی، ساده تر باشند و توزیع داده ها در آن ها نامتوازن تر باشد، طبقه بند حاصل بهتر عمل می کند. نوآوری این تحقیق، ارائه یک کران بالای خطا برای روش های مبتنی بر ترکیب طبقه بندها است که وابسته به پیچیدگی طبقه بندهای پایه و تعداد موثر آن ها است. بر اساس این معیارها، مدلی جدید برای طبقه بندی غیرخطی، پیشنهاد می گردد که شامل 3 مرحله ی تقسیم، مدل سازی و ترکیب است. الگوها در مرحله ی «تقسیم»، به دو یا چند بخش تقسیم می شود با این هدف که علاوه بر کاهش پیچیدگی موجود در آن ها، توزیع داده ها در آن ها نیز نامتوازن تر شود. مثلاً مشخصاً در اثر تقسیم، بخش بزرگی از داده ها جداپذیرخطی شود. در مرحله ی «مدل سازی»، مدلی برای توصیف هر بخش ارائه می گردد. در مرحله ی فوق، از روش های طبقه بندی خطی، روش های توصیف داده ها وطبقه بندهای تک کلاسه استفاده می شود. در مرحله ی «ترکیب»، طبقه بندهای خطی و مدل های ساخته شده برای هر بخش با یکدیگر ترکیب شده و طبقه بند نهایی را تشکیل می دهند. با انتخاب روش های مختلف تقسیم، مدل سازی و ترکیب، طبقه بندهای نمونه ای به نام های constraint embedded classifier(cec)، recursive cec(rcec) و cluster linear decision tree (cldt) ساخته شده است. سپس امید ریاضی کران بالای خطای آزمون مدل با معیار پیچیدگی rademacher و گاوسی محاسبه شده است. سازگاری و هم گرایی مدل نیز اثبات شده است. عمل کرد الگوریتم های ارائه شده با روش های طبقه بندی متداول مانند svm، k-nn، cart و adaboost روی مجموعه داده های دنیای واقعی مقایسه گردیده است. انجام آزمون های آماری روی نتایج مقایسه، برتری متوسط مدل نسبت به روش های دیگر را نشان می دهد. در نهایت تحلیل اثر انتخاب طبقه بند خطی پایه و هم چنین تحلیل نویز انجام شده است.

منابع مشابه

مدل سازی خطی سیستم های غیر خطی با کمک شبکه های عصبی مصنوعی بر پایه داده های ورودی – خروجی و کاربرد آن در بویلر نیروگاه

در این مقاله روش جدیدی برای مدل سازی خطی سیستم های غیر خطی ارائه می گردد . اساس روش پیشنهادی طراحی یک شبکه عصبی مصنوعی دو لایه و‌آموزش آن بر مبنای داده های ورودی- خروجی است . وزن های اتصالات این شبکه ضرایب تابع تبدیل هستند . در سیستم هایی که رفتار آنها خطی باشد ، روش حداقل کردن مربعات خطا (lse) بهترین نتایج مدل سازی را ارائه می نماید . در سیستم هایی که رفتار غیر خطی دارند ، نظیر بعضی قسمت های ب...

متن کامل

آزمون تعیین خطای مشخص سازی مدل خطی عام برای داده های گم شده

در این مقاله مدل خطی عام را در تحلیل داده‌هایی که در آنها متغیرهای کمکی و متغیر پاسخ گم شدگی دارند، در نظر می گیریم. برای تعیین نیکویی برازش مدل خطی عام در حضور داده‌های گم‌شده، آزمون جدیدی را بر اساس آزمون رمزی(1969) می سازیم. نشان می دهیم که تحت فرض صفر، آماره های آزمون در برخی از حالات از توزیع فیشر تبعیت می کند و در برخی از حالات به توزیع شبه‌فیشر میل می‌کند. علاوه بر این، عملکرد آمارههای آ...

متن کامل

مسائل برنامه ریزی خطی با قیود مکمل خطی

در این پایان نامه، مسائل بهینه سازی خطی با قیود مکمل خطی در برنامه ریزی مرتبه ای بررسی شده ‎ ‎است. به علاوه بهینه سازی خطی معکوس دو سطحی، برنامه ریزی قطعه ای خطی نامحدب، مسائل مرتبه دو نامعین و می نیمم سازی کوانتایل، مسأله برنامه ریزی خطی با قیود مکمل خطی روشی با قیود ثابت ارائه می دهد.

یک رویکرد جامع برای بخش بندی بازار و طبقه بندی مشتریان با استفاده از روش های داده کاوی و برنامه ریزی خطی

با گسترش فناوری و ظهور شرکت های الکترونیکی که انباشت داده های مشتریان در پایگاه داده را به همراه داشته، جذابیت بخش بندی بازار برای پژوهش گران فزونی یافته است. زیرا پایگاه داده مشتری یک داشته ارزشمند شرکت های الکترونیکی است که اگر به خوبی پردازش شود، می تواند شناخت بیشتری از مشتریان ارائه نماید. به همین دلیل روش های متعدد اما غیر منسجمی برای بخش بندی بازار و طبقه بندی مشتریان در علوم مختلف ارائه...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023