نام پژوهشگر: ایلناز خدادادی
ایلناز خدادادی سید رسول موسوی
ژنوم انسان ها در مکان های مشخصی با یک دیگر تفاوت دارند. چندریختی تک نوکلئوتیدی یا به اختصار اسنیپ، متداول ترین نوع این تفاوت هاست. اسنیپ ها نقش مهمی در کاربردهای وسیعی مانند تشخیص پزشکی و طراحی دارو ایفا می کنند و علاوه بر آن امکان ردیابی ژن های بیماری را فراهم می آورند. در موجودات دیپلوئیدی مانند انسان، دو کپی از هر کروموزوم وجود دارد (یکی از مادر و دیگری از پدر به ارث می رسد)؛ توالی اسنیپ ها روی هرکدام از دو کپی، هاپلوتیپ نامیده می شود. تکنولوژی های توالی یابی فعلی فقط می توانند قطعه هایی از ژنوم را به طول چند هزار جفت باز در اختیار قرار دهند اما نمی توانند مشخص کنند هر قطعه به کدام کپی تعلق دارد. بنابراین از روش های محاسباتی برای بدست آوردن هاپلوتیپ ها، از روی این قطعه ها استفاده می شود. تکنولوژی های توالی یابی مقدار کیفیت q را به عنوان نگاشت صحیحی از احتمال اشتباه بودن باز در اختیار قرار می دهند. بهترین روش ارائه شده مبنی بر فرموله سازی مسأله با استفاده از max-sat می باشد. در این پایان نامه، روش جدیدی ارائه شده که در آن از max-sat وزن دار و هم چنین مدل wmlf به جای max-sat و مدل mec به منظور به کار بردن مقادیر کیفیت برای دستیابی به دقت بالاتر استفاده شده است. مدل های مختلفی برای مسأله ی بازسازی هاپلوتیپ های یک فرد وجود دارد. در این پایان نامه نشان داده شده که یک مدل مبتنی بر محتمل ترین، پس از اعمال تقریب های عمدتاً معقولی به مدل mec تبدیل می شود که این امر نشان دهنده ی منطقی بودن این مدل علیرغم برخی از انتقادات در ادبیات مربوطه است. معیار ارزیابی جدیدی نیز به نام نرخ بازسازی وزن دار معرفی کرده ایم و به منظور ارزیابی روش پیشنهادی، آن را با دو روش دیگر براساس معیارهای پیشنهادی و mec مقایسه کرده ایم. نتایج این مقایسه روی داده ی واقعی متعلق به na12878 بهبود جزئی را نشان می دهد. لازم به ذکر است که دقت الگوریتم ها بالای 90% می باشد.