نام پژوهشگر: لیلا سادات تقوی

استخراج قوانین انجمنی عددی با معیارهای چندگانه با استفاده از الگوریتم فلزگداخته
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی مهندسی 1388
  لیلا سادات تقوی   بهروز مینایی

کاوش قوانین انجمنی یکی از روش‏های مهم و پرکاربرد داده‏کاوی است که روابط و وابستگی‏های متقابل بین مجموعه بزرگی از اقلام داده‏ای را نشان می‏دهند. بیشتر الگوریتم‏های موجود قوانین را در طی دو مرحله استخراج می‏کنند. در مرحله اول اقلام پر رخداد بر اساس معیار حداقل پشتیبان کشف می‏شوند و در مرحله دوم بر اساس معیار حداقل اطمینان قوانین قوی استخراج می‏شوند. این الگوریتم‏ها معمولاٌ قوانین را بر اساس یک معیار، به عنوان مثال، معیار اطمینان ارزیابی می‏کنند. این معیارها قوانین را بر اساس تعداد وقوع در پایگاه داده مورد بررسی قرار می‏دهند. ارزیابی تنها بر اساس تعداد وقوع مشکلاتی را به همرا دارد. این الگوریتم‏ها با پایگاه داده‏های گسسته کار می‏کنند لذا مقادیر ویژگی‏های عددی باید گسسته شود که این امر باعث از دست رفتن اطلاعات می‏شود. در این پایان نامه، مسأله کشف قوانین انجمنی به عنوان یک مسأله بهینه سازی چندمعیاری یا چند‏هدفی در نظر گرفته می شود و معیارهایی چون درک آسان وعدم پیچیدگی (طول قانون)، ضریب پشتیبان و ضریب اطمینان به عنوان معیارهای مسأله کشف قوانین ‏انجمنی در نظر گرفته می شود. این مسأله را با استفاده از الگوریتم anealing simulated حل خواهیم کرد. همچنین مسأله کشف قوانین‏ انجمنی عددی، را یک مسأله بهینه سازی سخت فرض می‏کنیم و روش پیشنهادی بازه های صفات عددی را همزمان با جستجوی قوانین انجمنی در یک بار اجرا می یابد. کارایی الگوریتم ارائه شده در تعیین بازه های صفات عددی بر روی داده های فرضی بررسی می شود و نتایج رضایت‏بخشی به دست می آید. این روش در مقابل سطوحی از نویز، تحمل‏پذیر است. در مقایسه با الگوریتم کوچ پرندگان سخت کارایی و نتایج خوبی دارد. در نهایت الگوریتم را در داده تحلیل وضعیت خانوارهای ایران به کار می بریم و قوانین جالبی به دست می آید. این روش برای کاربردهای عملی مختلف مناسب می باشد.