نام پژوهشگر: معصومه فضلی راد
معصومه فضلی راد امیر مسعود رحمانی
داده کاوی به عمل استخراج اطلاعات سودمند و دانش پنهان از پایگاه داده گفته می شود. کاوش قوانین انجمنی یکی از مهم ترین تکنیک های داده کاوی است که به استخراج الگوهای تکرار شونده از لابلای مجموعه اقلام پایگاه داده های تراکنشی با حجم بالا می پردازد و ریشه اصلی آن به تجزیه و تحلیل تعاملات نقطه فروش برمی گردد. اکثر الگوریتم های مرسوم کاوش قوانین انجمنی بر روی داده های دودویی کار می کنند، در حالی که پایگاه داده های استفاده شده در اکثر موارد تجاری و علمی حاوی داده های کمی هستند. این تحقیق برای کار با داده های کمی، مفاهیم منطق فازی و الگوریتم های کلاسیک کاوش قوانین انجمنی را مجتمع می کند تا قوانین انجمنی فازی مفید استخراج کند. از طرفی الگوریتم های فعلی کاوش قوانین انجمنی به گذرهای زیادی از پایگاه داده نیاز دارند، به همین دلیل سربار ناشی از عملیات ورودی/خروجی در این الگوریتم ها بسیار بالا است. در الگوریتم پیشنهادی، کل پایگاه داده فقط یک بار مورد بررسی قرار می گیرد. در این گذر، تراکنش های پایگاه داده به خوشه هائی تقسیم می شوند، به نحوی که تراکنش های هر خوشه بیشترین شباهت را به یکدیگر داشته باشند. سپس به جای اعمال الگوریتم های کاوش قوانین انجمنی فازی بر روی کل داده ها، این الگوریتم ها به صورت جداگانه و موازی بر روی داده های هر خوشه اجرا خواهند شد. نتایج تحقیق بر روی داده های فروش فرآورده های نفتی نشان داد که الگوریتم پیشنهادی نه تنها باعث افت دقت و صحت قوانین کشف شده نمی شود بلکه زمان اجرای الگوریتم را نیز کاهش می دهد.