نام پژوهشگر: لیلا سادات تقوی
لیلا سادات تقوی بهروز مینایی
کاوش قوانین انجمنی یکی از روشهای مهم و پرکاربرد دادهکاوی است که روابط و وابستگیهای متقابل بین مجموعه بزرگی از اقلام دادهای را نشان میدهند. بیشتر الگوریتمهای موجود قوانین را در طی دو مرحله استخراج میکنند. در مرحله اول اقلام پر رخداد بر اساس معیار حداقل پشتیبان کشف میشوند و در مرحله دوم بر اساس معیار حداقل اطمینان قوانین قوی استخراج میشوند. این الگوریتمها معمولاٌ قوانین را بر اساس یک معیار، به عنوان مثال، معیار اطمینان ارزیابی میکنند. این معیارها قوانین را بر اساس تعداد وقوع در پایگاه داده مورد بررسی قرار میدهند. ارزیابی تنها بر اساس تعداد وقوع مشکلاتی را به همرا دارد. این الگوریتمها با پایگاه دادههای گسسته کار میکنند لذا مقادیر ویژگیهای عددی باید گسسته شود که این امر باعث از دست رفتن اطلاعات میشود. در این پایان نامه، مسأله کشف قوانین انجمنی به عنوان یک مسأله بهینه سازی چندمعیاری یا چندهدفی در نظر گرفته می شود و معیارهایی چون درک آسان وعدم پیچیدگی (طول قانون)، ضریب پشتیبان و ضریب اطمینان به عنوان معیارهای مسأله کشف قوانین انجمنی در نظر گرفته می شود. این مسأله را با استفاده از الگوریتم anealing simulated حل خواهیم کرد. همچنین مسأله کشف قوانین انجمنی عددی، را یک مسأله بهینه سازی سخت فرض میکنیم و روش پیشنهادی بازه های صفات عددی را همزمان با جستجوی قوانین انجمنی در یک بار اجرا می یابد. کارایی الگوریتم ارائه شده در تعیین بازه های صفات عددی بر روی داده های فرضی بررسی می شود و نتایج رضایتبخشی به دست می آید. این روش در مقابل سطوحی از نویز، تحملپذیر است. در مقایسه با الگوریتم کوچ پرندگان سخت کارایی و نتایج خوبی دارد. در نهایت الگوریتم را در داده تحلیل وضعیت خانوارهای ایران به کار می بریم و قوانین جالبی به دست می آید. این روش برای کاربردهای عملی مختلف مناسب می باشد.