فاطمه السادات فاطمیون

نام پژوهشگر: فاطمه السادات فاطمیون

تحلیل خوشه بندی برای داده بیان ژن با استفاده از تجزیه ماتریس نامنفی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه یزد 1390
فاطمه السادات فاطمیون سید ابوالفضل شاهزاده فاضلی

امروزه حجم عظیمی از مطالعات پزشکی در جهت شناسایی و درمان بیماری هایی است که از طریق ژن منتقل می شود. برای بررسی و نگهداری اطلاعات ژنتیکی، فناوری های مفیدی به وجود آمده است که یکی از ‎‎‎آن ها‏، فناوری ریزآرایه می باشد. تجزیه و تحلیل اطلاعات به دست آمده از ریزآرایه ها به کمک روش های داده کاوی انجام می شود. یکی از این روش ها خوشه بندی است که می تواند در یافتن گروه های واقعی و نهفته در داده ها موثر باشد. همچنین با استفاده از روش های کاهش بعد می توان مجموعه داده هایی با حجم کوچک تر از مجموعه داده های اصلی تولید کرد و آن را به عنوان ورودی روش خوشه بندی به کار برد. در این رساله از تجزیه ی ماتریس نامنفی‎‎‎‎ (nmf)‎ ‎‎ برای کاهش بعد داده های ریزآرایه استفاده می شود. همچنین برای مقداردهی اولیه این تجزیه روش های تصادفی‏، تحلیل مولفه اصلی ‎(‎pca)‎‎ و تجزیه ی مقدار تکین مضاعف نامنفی ‎(‎nndsvd)‎‎ به کار می رود. پس از آن با ‎‎‎به کارگیری روش ‎$ ‎k‎ $‎-متوسط داده های کاهش یافته‏ خوشه بندی می گردد. تحلیل های انجام شده در این تحقیق نشان می دهد که ‎خوشه بندی داده های حاصل از nmf+pca نتایج بهتری را ارائه می دهد‎.

۱۵ صفحه ی اول