نام پژوهشگر: محمد حسین فردوسی
محمد حسین فردوسی مهدی صادقی
از آنجا که چند شکلی تک نوکلئوتیدی (snp) مسئول 90 درصد تفاوت در بین گونه ها است، امروزه به میزان زیادی جهت بررسی تنوع زیستی در حیوانات استفاده می شود. به علت اینکهsnp ها دارای تنوع محدودی هستند بیشتر از هاپلوتیپ جهت بررسی این گونه تنوع ها استفاده می گردد. تعیین هاپلوتیپ در آزمایشگاه بسیار هزینه بر است، بنابراین در بیشتر موارد با استفاده از داده های ژنوتیپ، هاپلوتیپ را استنباط می کنند. الگوریتم های متعددی برای استنباط هاپلوتیپ وجود دارد. هدف از انجام این تحقیق بررسی دقت و سرعت الگوریتم های موجود با توجه به تعداد افراد، تعداد snp ها، میزان هتروزیگوسیته و نرخ نوترکیبی بود. برای این منظور یک جمعیت شبیه سازی شد و نمونه هایی از آن به صورت تصادفی گرفته شد. این داده ها از لحاظ تعداد افراد، تراکم snp و نرخ نوترکیبی متفاوت بودند. سپس این داده ها توسط نرم افزاری که طراحی شده بود به فرمت ورودی نرم افزارهایی که از این الگوریتم ها جهت استنباط هاپلوتیپ استفاده می کنند تبدیل شده و در نهایت عملکرد و سرعت الگوریتم ها توسط چندین معیار مورد بررسی قرار گرفت. در این بررسی مشخص شد که الگوریتم نرم افزار2snp بالاترین سرعت و نرم افزار های phase و shapeit بالا ترین دقت را دارند گرچه سرعت استنباط با نرم افزار phase در صورتی که تعداد snp و هاپلوتیپ افزایش یابد کاهش می یابد ولی سرعت shapeit کاهش محسوسی ندارد و دقت آن تقریباً برابر phase است. نرم افزار های gerbil و haplotyper با توجه به سرعت انجام محاسبات نسبت به دیگر الگوریتم ها در همان زمان اجرا بالاترین دقت را دارند. با افزایش تعداد افراد دقت تمامی الگوریتم ها افزایش یافته و همچنین تفاوت دقت استنباط بین جایگاه های با هتروزیگوسیته بالا و پایین کاهش می یابد.