نام پژوهشگر: فاطمه حلم زاده

طبقه بندی سنجه های جذابیت برای تحلیل خوشه بندی دسته بندی داده ها، موردکاوی داده های بیماری قلبی کرونری
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده فنی 1392
  فاطمه حلم زاده   محمد مهدی سپهری

از آنجا که یکی از مهمترین عوامل مرگ و میر در جوامع امروزه، بیماری های قلبی است، بررسی چرایی و چگونگی تشخیص و پیش بینی آنها بسیار مورد توجه محققین قرار گرفته است. داده کاوی، که یکی از مهمترین ابزار تحلیل داده ها و کشف روابط بین آنها و پیش بینی وقوع حوادث است، از کاربردی ترین ابزارهای محققین در این راه محسوب می گردد. این پژوهش بعد از تشریح اهمیت تحقیق در زمینه ی مورد بحث، به مروری کوتاه بر استفاده های داده کاوی در حوزه سلامت و درمان می پردازد. سپس مروری بر تحقیقات انجام شده در زمینه استفاده از داده کاوی در حوزه تشخیص و پیش بینی بیماری های قلبی انجام می گیرد. پس از آن به تبیین روشی جهت تشخیص گرفتگی عروق کرونر قلب پرداخته می شود. در این روش که بر روی داده های 3200 مراجعه کننده به بیمارستان مرکز قلب تهران انجام شده است، پس از انجام پیش پردازش بر روی داده ها و متوازن نمودن آنها، داده ها به دو دسته داده های آموزش و آزمون تفکیک می شوند. در نخستین گام برای تحلیل داده ها، ابتدا داده های آموزش دسته بندی شدند و نتیجه ی آن با داده های آزمون سنجیده شد. دقت این کار 84 % برآورد شد. در دومین گام برای تحلیل، ابتدا داده ها به یک الگوریتم خوشه بندی داده شد و با استفاده از خوشه های منسوب شده، برچسب گذاری جدید انجام شد و در نهایت به وسیله درخت تصمیم دسته بندی شد. سنجیدن نتایج این روش با داده های آزمون دقتی معادل 93% را نمایش داد. در مرحله بعد برای تشخیص میزان شدت بیماری، مجددا روش خوشه بندی- دسته بندی بر روی داده های بیماران اعمال شد که دقت به 62% رسید. در مرحله ی آخر پژوهش به بررسی سنجه های جذابیت قابل استفاده در این حوزه پرداخته شد. معیارهای ذهنی و عینی قابل استفاده در این حوزه شناسایی و بر روی روش پیشنهادی اعمال شد.