نام پژوهشگر: سمیرا رمضانی
سمیرا رمضانی سید رسول موسوی
یک هاپلوتیپ مجموعه ای از چندشکلی های تک نوکلئوتیدی (اسنیپ ها)، و اسنیپ از معمول ترین تغییرات ساختاری می باشد. از آنجایی که برخی از بیماری های ژنتیکی ناشی از تغییرات در ساختار ژنوم است، بررسی هاپلوتیپ ها مورد توجه بسیاری از محققین قرارگرفته است. بدلیل محدودیت های تکنیکی در بدست آوردن هاپلوتیپ ها، در اغلب موارد به جای هاپلوتیپ ها از ژنوتیپ ها که اطلاعات کمتری را در بر دارند استفاده می شود. لذا مسئله بدست آوردن یک مجموعه هاپلوتیپ از روی ژنوتیپ ها، که استنباط هاپلوتیپ نامیده می شود، از اهمیت ویژه ای برخوردار است. در صورتی که برای یک مجموعه ژنوتیپ به دنبال یافتن کمترین تعداد هاپلوتیپ مورد نیاز برای توصیف آن مجموعه باشیم مسئله استنباط هاپلوتیپ با دیدگاه صرفه جویی کامل را داریم. نشان داده شده است که مسئله استنباط هاپلوتیپ، در حالت صرفه جویی کامل، یک مسئله np-سخت می باشد. از زمان ارائه اولین الگوریتم توسط کلارک تا کنون روش های متعددی برای حل این مسئله مطرح شده، که به دو دسته الگوریتم های دقیق و غیر دقیق تقسیم می شوند. در حال حاضر بهترین الگوریتم دقیق برای این مسئله استنباط هاپلوتیپ در دیدگاه صرفه جویی کامل الگوریتمships می باشد که مسئله را به تعدادی مسئله ارضای بولین کاهش می دهد. متاسفانه زمان اجرای این الگوریتم، علی رغم بهبودهای صورت گرفته، برای اندازه های بزرگ مسئله زیاد بوده و هنوز روش های افزایش سرعت برای آن مورد نیاز می باشد. در الگوریتم های غیر دقیق نیز الگوریتم collhaps بهترین کارایی را دارد،که یک الگوریتم مکاشفه ای می باشد. اما می توان هنوز کارایی آن را بهبود بخشید. در این پایان نامه دو الگوریتم پیشنهاد شده است. یکی از این الگوریتم ها دقیق و دیگری غیر دقیق می باشد. در حقیقت الگوریتم دقیق ارائه شده بهبودی بر بهترین الگوریتم دقیق موجود می باشد. الگوریتم مکاشفه ای ارائه شده نیز بهبودی بر الگوریتم collhaps می باشد. سپس از الگوریتم مکاشفه ای پیشنهادی به عنوان بخش پیش پردازش در الگوریتم پیشنهادی دقیق ارائه شده استفاده می گردد. کارایی هر کدام از الگوریتم های پیشنهادی توسط آزمایشات متعدد برای روی چندین مجموعه داده تایید می گردد.