طبقه بندی داده ها با استفاده از برنامه ریزی ریاضی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده علوم ریاضی
- نویسنده آلاله مسکوکی
- استاد راهنما حسین تقی زاده کاخکی رضا قنبری
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
در این پایان نامه، به معرفی مسأله طبقه بندی پرداختیم و برخی از روش های رایج برای حل این مسأله از جمله روش بیز، شبکه عصبی، درخت تصمیم و توابع جداکننده را به طور مختصر شرح دادیم. روش برنامه ریزی ریاضی، که بر پایه تولید رویه ها در فضای ویژگی ها است، برای حل مسأله طبقه بندی خصوصاً برای حالت دوگروهی به دلیل دقت بالای آن در کاربرد های عملی، تاکنون بسیار مورد مطالعه قرار گرفته است. یکی از تعمیم های مدل برنامه ریزی خطی، تولید چندوجهی ها برای تخمین مرزهای غیرخطی و افراز فضای ویژگی ها است. مدل mcp یک روش بر پایه یک مدل برنامه ریزی عدد صحیح برای حل مسأله چندگروهی است که توسط خو و پاپاجئورجیو [107] ارائه شده است. در این روش، ابتدا یک مدل برنامه ریزی عدد صحیح حل می شود و k ناحیه به صورت ابرمکعب هایی در فضای ویژگی ها، با هدف مینیمم کردن تعداد داده های نادرست طبقه بندی شده، تولید می شود به طوری که هر ابرمکعب به یک کلاس از داده ها اختصاص می یابد. سپس برای افزایش دقت طبقه بندی، با یک الگوریتم تکراری، ابرمکعب های بیشتری به ازاء هر کلاس تولید می شود تا زمانی که اضافه کردن ابرمکعب جدید باعث بهتر شدن جواب نگردد. از نقاط قوت الگوریتم mcp دقت بالای آن، به ویژه، بر روی داده هایی با نواحی مجزا و دارای درهم رفتگی زیاد است. اما از طرف دیگر، در هر تکرار الگوریتم mcp، یک مدل برنامه ریزی عدد صحیح با پارامتر های جدید، حل می شود که این امر باعث افزایش زمان محاسباتی و در نتیجه کاهش کارایی روش بر روی مجموعه هایی از اندازه بزرگ می گردد. در فصل آخر پایان نامه، تغییراتی را در الگوریتم mcp پیشنهاد کردیم که اعمال آن، زمان محاسباتی را به طور قابل ملاحظه ای کاهش می دهد. ایده الگوریتم پیشنهادی (mcpm)، استفاده از مرزهای به دست آمده از تکرارهای قبل و کنارگذاشتن داده های درست طبقه بندی شده است. این کار، باعث حذف تعداد زیادی متغیر صفر و یک می شود و در نتیجه زمان محاسباتی گام به گام کاهش می یابد. علاوه بر متغیرهای عدد صحیح متناظر با هر یک از داده ها، تعداد زیادی از متغیرهای صفر و یک، که به منظور عدم تداخل ابرمکعب های غیر هم کلاس در نظر گرفته شده اند، نیز کاهش می یابند. در بخش 1.2.5 نشان دادیم که تعداد این متغیرها در مدل mcp همواره از mcpm بیشتر است و افزایش این تعداد در mcp از مرتبه 2 و در mcpm از مرتبه 1 است. عملکرد دو الگوریتم mcp و mcpm، توسط سه مجموعه داده واقعی مقایسه شده است. نتایج محاسباتی بر روی این مثال ها نشان می دهند که mcpm کمی از دقت mcp می کاهد و در عوض سرعت را به طور قابل ملاحظه ای بالا می برد. از آن جایی که در برخی از کاربردهای عملی، زمان ارزشمندتر از دقت بالا است، mcpm را می توان به عنوان روشی که در زمانی کمتر از mcp، جوابی با دقت تقریباً بالا به دست می دهد، به کار برد. اگر چه روش پیشنهادی بر روی مجموعه های از اندازه کوچک و متوسط ارزیابی شده است و بررسی های بیشتری لازم است تا کارایی الگوریتم را بر روی مثال های بزرگ تر با خصوصیات متفاوت، اندازه گیری کند. لازم به ذکر است که mcpm، همانند روش هایی مثل lda، smo و بسیاری از مدل های برنامه ریزی ابرصفحه ای مثل dea-daبرای طبقه بندی داده هایی با نواحی مجزا مناسب نیست. روش mcpm می تواند یک نقطه شروع نزدیک به بهینه را فراهم کند. همچنین، این روش را می توان به صورت ترکیبی با الگوریتم های طبقه بندی دیگر به کار برد.
منابع مشابه
ارائه روشی برای طبقه بندی داده های ابرطیفی aviris ، با استفاده از استخراج ویژگی و ترکیب طبقه بندی کننده ها
یکی از پرکاربردترین روش های طبقه بندی نظارت شده، روش بیشترین احتمال است که در آن، به منظرو طبقه بندی از پارامترهایی آماری مانند ماتریس واریانس کوواریانس استفاده می شود. در تصاویر ماهواره ای ابر طیفی، به علت محدودیت نمونه های آموزشی و ابعاد بالای طیفی (زیاد بودن تعداد باند ها)، احتمال یکتا شده ماتریس های برآورد شده و با کاهش دقت طبقه بندی وجود دارد. به منظور حل این مشکل از روش های مختلفی همچون ک...
متن کاملطبقه بندی متقاضیان تسهیلات اعتباری بانکی با استفاده از داده کاوی و منطق فازی
در این پژوهش، هدف، بهره گیری از ابزارهای داده کاوی و منطق فازی برایطبقه بندی مشتریان تسهیلات اعتباری می باشد به طوریکه ابهامات و عدم قطعیت رادر خصوص طبقات مشتریان و نیز متغیرهای تاثیر گذار در رفتار آنها را پوشش دهد.روش کار بدین شکل می باشد که طبق یک فرایند استاندارد داده کاوی، داده هایمشتریان سابق بانک سامان جمع آوری و پالایش شده و سپس طبقات و متغیرهاییکه قابلیت فازی کردن داشتند، طبق نظر کارشنا...
متن کاملبرنامه ریزی فعالیت های نگهداری و تعمیرات با استفاده از شبیه سازی و تحلیل پوششی داده ها
برنامهریزی فعالیتهای نگهداری و تعمیرات، بهخصوص برای سازمانها و صنایع بزرگ اهمیت زیادی دارد. چنانچه ملاحظات ایمنی و اقتصادی را به طور همزمان در نظر بگیریم، اهمیت مسئله را از دیدگاه مدلسازان و مدیران بیشتر میسازد. در این پژوهش فعالیتهای نگهداری و تعمیرات سیستم تولیدی بررسی شده است. در ابتدا، با استفاده از شبیهسازی AweSim فعالیتهای نگهداری و تعمیرات این سیستم شبیهسازی شده است. توابع تولی...
متن کاملبرنامه ریزی منابع در زمان بحران با استفاده از الگوهای ریاضی
برنامه ریزی، سازماندهی و هدایت منابع در هنگام بحران از موضوعات اساسی در مدیریت بحران قلمداد می شود. در مقاله حاضر برای سه وضعیت بحران و با استفاده از برنامه ریزی ریاضی اقدام به تخصیص منابع شده است. می توان مدیریت منابع را از منظر بحران های طبیعی، بحران های صنعتی مورد توجه قرار داد. لذا ضرورت برنامه ریزی و آمادگی قبلی به عنوان بخشی از اقدامات پیشگیرانه مطرح می باشند. در این مقاله سه استراتژی برا...
متن کاملطبقه بندی داده ها با استفاده از مدلهای ترتیبی
کمبل در سال 1991 یک روش شبیه سازی برای برازش مدل به داده های ترتیبی انجام داد. نتایج شبیه سازی کمبل نشان داد که وقتی هدف اصلی طبقه بندی کردن داده ها باشد مدلهای ترتیبی هیچ مزیتی بر مدلهای غیرترتیبی ندارد. کمبل در مقاله خود شبیه سازی را بدون در نظر گرفتن انواع مختلف داده ها و خواص آنها انجام داده است . در این تحقیق ما موضوع را با دیدگاه دیگری بررسی می کنیم. در این نوشتار با توجه به نوع گسسته یا ...
15 صفحه اولطبقه بندی فازی با استفاده از تحلیل پوششی داده ها
چکیده امروزه در دنیا، با حجم عظیمی از داده ها واطلاعات مواجه هستیم که بنا به ضرورت جهت بهره برداری بهتر وسریعتر نیازمند به دسته بندی وطبقه بندی آنها می باشیم. برای انجام عمل طبقه بندی روش های مختلفی موجود است که یکی از متداول ترین روشها، روش طبقه بندی فازی با استفاده از تحلیل پوششی دادههاست که برروی واحد های تصمیم گیرنده عمل کرده و روشی جدید محسوب می گردد. در این پایان نامه یک سیستم دسته ب...
منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده علوم ریاضی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023