نام پژوهشگر: مریم حسنعلی

ارائه روش جدید برای یافتن قوانین انجمنی فازی با چندین کمینه ضریب پشتیبان در پایگاه داده رابطه ای
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده کامپیوتر و فناوری اطلاعات 1391
  مریم حسنعلی   بهروز مینایی

دسته ای از الگوریتم های داده کاوی به استخراج قوانین انجمنی موجود در یک جدول می پردازد. در حالی که بیشتر داده های موجود در پایگاه داده شامل چندین جدول ذخیره شده اند. مشکلات ناشی از ادغام جداول و تبدیل آن ها به یک جدول، ما را به سوی داده کاوی رابطه ای رهنمون می سازد. در اینجا از یکی از الگوریتم های موجود در کاوش قوانین انجمنی رابطه ای که mrfp-growth نام دارد، برای یافتن الگوهای پرتکرار استفاده می شود. در کاوش قوانین انجمنی برای داده های کمی (عددی) از روش تقسیم بندی بازه ای اعداد استفاده می شود. مشکل بازه های تند وجود دارد به طوری که اجزای نزدیک محدوده بازه یا نادیده گرفته می شود یا تاکید زیادی بر آن ها می شود. برای رفع مشکل بازه های تند به فازی سازی ویژگی های عددی می پردازیم. از طرف دیگر، اقلام مختلف دارای معیارهای متفاوتی برای انتخاب شدن دارند و استفاده از یک کمینه ضریب پشتیبان باعث به وجود آمدن مشکل اقلام نادر می شود. فازی سازی ویژگی های عددی، از طریق انتخاب یک تابع عضویت مناسب، باعث بهبود مشکل بازه های تند می شود. برای رفع مشکل اقلام نادر نیز از چندین کمینه ضریب پشتیبان برای اقلام مختلف استفاده می کنیم. به طوری که کمینه ضریب پشتیبان به عنوان درصدی از تعداد کل هر قلم کالا در نظر گرفته می شود. استفاده از این روش باعث بهبود نسبی این روش می شود. تعداد الگوها بعد از فازی سازی و استفاده از چندین کمینه ضریب پشتیبان به طور مناسبی کاهش می یابد ولی زمان اجرا افزایش می یابد، همچنین میانگین طول الگوها در این حالت افزایش می یابد و در نتیجه الگوهای رابطه ای طولانی تری که حاوی اطلاعات بیشتری هستند، به وجود می آید.