نام پژوهشگر: محمد سروری

استفاده از روشهای یادگیری ماشین برای تطبیق دنباله های بیولوژیکی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند 1390
  محمد سروری   سید حمید ظهیری

یکی از مهمترین موضوعات مورد بررسی در زیست شناسی و بیواینفورماتیک، مسئله مقایسه و تطبیق دنباله های زیستی است. مدل مخفی مارکوف یکی از الگوریتم های یادگیری ماشین می باشد که در زیست شناسی محاسباتی کاربرد فراوانی دارد. در این پایان نامه، ساختار مدل مخفی مارکوف و کاربرد آن در هم ترازی و خوشه بندی دنباله های زیستی مورد بررسی قرار گرفته است. از آنجایی که مدل مخفی مارکوف یک ابزار قوی برای یافتن شباهت بین داده های ترتیبی با طول های متغیر است، برای خوشه بندی دنباله ها، از آن استفاده شده است. در روش ارائه شده، هر دنباله زیستی بوسیله یک مدل مخفی مارکوف که با الگوریتم بهینه سازی گروه ذرات بهینه شده، مدل می شود. سپس با استفاده از پارامترهای بدست آمده، خوشه بندی بر مبنای یک تعریف جدید از ماتریس فاصله، انجام می شود. بهینه سازی پارامترهای مدل مخفی مارکوف با استفاده از الگوریتم جستجوی گرانشی نیز صورت گرفته است. در نهایت هم ترازی دنباله ها، با استفاده از روش خوشه بندی پیشنهادی و پروفایل مدل مخفی مارکوف، انجام می گیرد. آزمایش های انجام شده برروی دنباله های زیستی نظیر ژن ها نشان می دهد که الگوریتم پیشنهاد شده می تواند در انجام مقایسه بین دنباله های زیستی، بصورت بسیار کارامد و موثر، بکار گرفته شود.