نام پژوهشگر: میلاد زندی

استفاده از روش های پیش بینانه برای کشف موارد نادر در سری های زمانی پزشکی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - پژوهشکده برق و کامپیوتر 1392
  میلاد زندی   محمد رضا زارع میرک آباد

فرآیند داده کاوی بیشتر توجه خود را معطوف به کشف الگوهای عام برای توصیف اکثریت معنادار داده ها کرده است. اما با گذشت زمان مسائلی در حوزه داده کاوی مطرح شد، که نیازمند کشف مواردی بود که از الگوی عام داده ها تبعیت نمی کرد. به دلیل تکرار کم این موارد استفاده از روش های معمول کشف الگو کارایی خود را از دست می دهند. اهمیت بحث کشف موارد نادر نه تنها از کشف الگوهای عام کم اهمیت تر نیست، بلکه در مواردی از اهمیت بیشتری نیز برخوردار است. سری های زمانی یکی از انواع داده های ترتیبی هستند که به فراوانی در تحقیقات علمی، مباحث تجاری و پزشکی کاربرد دارند. یکی از روش هایی که در بحث تجزیه و تحلیل این نوع داده ای مطرح است، گسسته سازی سری زمانی و اعمال روش های معمول داده کاوی است. در این پایان نامه پس از بررسی روش های گسسته سازی سری زمانی و انتخاب روش sax به عنوان روشی که گسسته سازی را به خوبی انجام می دهد، از دنباله های بدست آمده از این روش برای آموزش مدل مخفی مارکف و پیش بینی موارد نادر استفاده می شود. پیاده سازی اولیه منجر به دقت پایین 67% و 5% گردید که با استفاده از مدل مخفی مارکف مبتنی بر حدآستانه دقت مدل به 96% و 99% افزایش یافت، که در نوع خود بی نظیر است. همچنین پس از بررسی های انجام شده برای حل چالش تعیین مناسب طول کلمه سری زمانی در روش sax، راه حل جدیدی برای تعیین طول این پارامتر به جای روش تجربی ارائه می شود.