نام پژوهشگر: مریم بابایی زارچ
مریم بابایی زارچ سید ابوالفضل شاهزاده فاضلی
پردازش رشته های ژنتیکی برای مقاصد انتخاب و طبقه بندی ژن ها از اهداف اساسی علم بیوانفورماتیک، به عنوان پیوندی بین علوم کامپیوتر و علوم ژنتیکی است. فرایند انتخاب رشته های ژنتیکی به معنای کشف مواردی از بروز یک ژن خاص و مرتبط، ولی با شکل های متفاوت است؛ که ممکن است در مقاطع زمانی مختلف در بافت های متفاوت ظاهر شده باشند، درحالی که طبقه بندی به دسته بندی ژن های مرتبط با هم در جریان نمونه های مختلف می پردازد. در فرایند انتخاب، تفاوت اساسی داده های ژنی در شرایط زمانی متفاوت مورد بررسی قرار می گیرد، درحالی که در طبقه بندی لزوماً نمونه هایی از یک ژن در اختیار نبوده و گاهاً ممکن است تعداد زیادی داده ژنی برای یافتن بزرگترین دسته ژن دخیل در ایجاد یک بیماری مورد مطالعه قرار گیرند. از مهمترین مسائلی که در این زمینه مطرح است می توان به تعدد ابعاد مسئله که گاه بالغ بر چند صد هزار بعد می شود اشاره نمود. برای یافتن حداقل تعداد ابعاد لازم برای نمایش یک بردار ژنی باید از روش های کاهش ابعاد توام با طبقه بندی استفاده نمود. یکی ازچالش های بیوانفورماتیک توسعه روش های سودمند برای آنالیز داده رشته ژن است. انتخاب مناسب روش آنالیز داده وابسته به داده و اهداف یک آزمایش است. در این پایان نامه سعی خواهد شد با استفاده از سه روش اساسی که شامل روش تجزیه مقدار تکین (svd) و روش های خطی تحلیل مولفه های اصلی و تحلیل مولفه های اصلی بلوکی خواهد بود انتخاب و طبقه بندی نمونه های سرطانی را به انجام رسانید.