نام پژوهشگر: شکوفه میرزائی

روش گروه بندی در داده کاوی با استفاده از پرومتی 2 مطالعه موردی: گروه بندی مشتریان شرکت صنعتی بهشهر (ساولا)
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده صنایع و سیستمها 1387
  شکوفه میرزائی   رضا حجازی

امروزه با توجه به گسترش روزافزون انبار داده¬ها در بنگاه¬های تجاری و ذخیره حجم انبوهی از داده¬ها، نیاز به ابزاری که بتواند در این دریای داده حرکت کرده و الگوها و روابط موجود میان داده¬ها را استخراج نماید بیش از پیش احساس می¬شود. داده¬کاوی یکی از مهم-ترین ابزارها در این زمینه است و تاکنون تحقیقات گسترده¬ای در خصوص آن صورت گرفته است. اما بیشتر روش¬های کاوش داده که تاکنون ارائه شده¬اند به تصمیم¬گیرنده اجازه نمی¬دهند ترجیحات خود را وارد مدل داده¬کاوی نماید. از آنجاکه در روش¬های تصمیم¬گیری با معیارهای چندگانه این امکان برای تصمیم¬گیرنده فراهم می¬شود، اخیراً توجه محققان به استفاده از روش¬های تصمیم¬گیری با معیارهای چندگانه در داده¬کاوی جلب شده است. با این توضیح، در این پایان¬نامه هدف ارائه روشی برای گروه¬بندی داده¬ها در داده¬کاوی بر مبنای یکی از روش¬های تصمیم¬گیری با معیارهای چندگانه (روش پرومتی) می¬باشد. پرومتی یکی از روش¬های تصمیم¬گیری با معیارهای چندگانه می¬باشد که تاکنون کاربردهای موفقی داشته است. با توجه به بکر بودن استفاده از روش پرومتی در مقوله داده¬کاوی و همچنین کاربردهای موفقی که این روش در مسائل دنیای واقعی داشته است، در این تحقیق این روش به¬عنوان مدل منخب تصمیم¬گیری با معیارهای چندگانه برای ارائه مدل داده¬کاوی مورد استفاده واقع شده و چهارچوب مدل گروه¬بندی داده¬ها بر اساس آن تشریح شده است. برای تخمین پارامترهای مسئله گروه¬بندی با استفاده از پرومتی (یعنی نقاط تفکیک و وزن¬ها) یک مدل برنامه¬ریزی خطی و برای آن که مدل توانایی رویارویی با حجم عظیم داده¬ها را داشته باشد دو رویکرد جایگزین ارائه شده است. رویکرد اول بر مبنای انتخاب درصدی از گزینه¬های برتر هر گروه استوار است و مسئله اصلی در این رویکرد، تعیین درصد مناسبی از گزینه¬هایی است که باید از هر گروه انتخاب و وارد مدل شوند که این کار در این پایان نامه با استفاده از یک الگوریتم سعی و خطا انجام می¬شود. رویکرد دوم بر مبنای انتخاب یک نمونه تصادفی از هر گروه و وارد نمودن این نمونه¬ها به مدل گروه¬بندی می¬باشد. در نهایت به¬منظور اعتبار سنجی و مقایسه نتایج حاصله، مدل ارائه شده در این تحقیق بر روی انبار داده¬های واقعی مشتریان شرکت صنعتی بهشهر(ساولا) اجرا شده است. برای اعتبار سنجی مدل، روش اعتبارسنجی تقاطعی 10-بسته¬ای به کار برده شده است که با رسم نمودار دقت مدل طی 10 بار اجرا و شکل هموار آن اعتبار مدل محرز می¬شود. با تفکیک داده¬های موجود به داده¬های آموزشی و آزمایشی واجرای مدل برای تخمین گروه داده¬های آزمایشی، تشکیل ماتریس¬های ارزیابی و تعیین میزان دقت مدل نشان دهنده آن است که مدل ارائه شده تحت هر دو رویکرد فوق با تقریب خوبی می¬تواند گروه مشتریان را به درستی تعیین نماید. همچنین مقایسه نتایج حاصله با نتایج حاصل از داده¬کاوی با استفاده از روش تاپسیس و درخت تصمیم نیز تأیید دیگری بر عملکرد مناسب مدل در پیش بینی گروه مشتریان می¬باشد. ?