نام پژوهشگر: فاطمه السادات فاطمیون
فاطمه السادات فاطمیون سید ابوالفضل شاهزاده فاضلی
امروزه حجم عظیمی از مطالعات پزشکی در جهت شناسایی و درمان بیماری هایی است که از طریق ژن منتقل می شود. برای بررسی و نگهداری اطلاعات ژنتیکی، فناوری های مفیدی به وجود آمده است که یکی از آن ها، فناوری ریزآرایه می باشد. تجزیه و تحلیل اطلاعات به دست آمده از ریزآرایه ها به کمک روش های داده کاوی انجام می شود. یکی از این روش ها خوشه بندی است که می تواند در یافتن گروه های واقعی و نهفته در داده ها موثر باشد. همچنین با استفاده از روش های کاهش بعد می توان مجموعه داده هایی با حجم کوچک تر از مجموعه داده های اصلی تولید کرد و آن را به عنوان ورودی روش خوشه بندی به کار برد. در این رساله از تجزیه ی ماتریس نامنفی (nmf) برای کاهش بعد داده های ریزآرایه استفاده می شود. همچنین برای مقداردهی اولیه این تجزیه روش های تصادفی، تحلیل مولفه اصلی (pca) و تجزیه ی مقدار تکین مضاعف نامنفی (nndsvd) به کار می رود. پس از آن با به کارگیری روش $ k $-متوسط داده های کاهش یافته خوشه بندی می گردد. تحلیل های انجام شده در این تحقیق نشان می دهد که خوشه بندی داده های حاصل از nmf+pca نتایج بهتری را ارائه می دهد.