نام پژوهشگر: میلاد زندی
میلاد زندی محمد رضا زارع میرک آباد
فرآیند داده کاوی بیشتر توجه خود را معطوف به کشف الگوهای عام برای توصیف اکثریت معنادار داده ها کرده است. اما با گذشت زمان مسائلی در حوزه داده کاوی مطرح شد، که نیازمند کشف مواردی بود که از الگوی عام داده ها تبعیت نمی کرد. به دلیل تکرار کم این موارد استفاده از روش های معمول کشف الگو کارایی خود را از دست می دهند. اهمیت بحث کشف موارد نادر نه تنها از کشف الگوهای عام کم اهمیت تر نیست، بلکه در مواردی از اهمیت بیشتری نیز برخوردار است. سری های زمانی یکی از انواع داده های ترتیبی هستند که به فراوانی در تحقیقات علمی، مباحث تجاری و پزشکی کاربرد دارند. یکی از روش هایی که در بحث تجزیه و تحلیل این نوع داده ای مطرح است، گسسته سازی سری زمانی و اعمال روش های معمول داده کاوی است. در این پایان نامه پس از بررسی روش های گسسته سازی سری زمانی و انتخاب روش sax به عنوان روشی که گسسته سازی را به خوبی انجام می دهد، از دنباله های بدست آمده از این روش برای آموزش مدل مخفی مارکف و پیش بینی موارد نادر استفاده می شود. پیاده سازی اولیه منجر به دقت پایین 67% و 5% گردید که با استفاده از مدل مخفی مارکف مبتنی بر حدآستانه دقت مدل به 96% و 99% افزایش یافت، که در نوع خود بی نظیر است. همچنین پس از بررسی های انجام شده برای حل چالش تعیین مناسب طول کلمه سری زمانی در روش sax، راه حل جدیدی برای تعیین طول این پارامتر به جای روش تجربی ارائه می شود.