نام پژوهشگر: موسی قهرمانزاده باروق

ارزیابی عملکرد روش های blast و h-tuple در مقایسه توالی های زیستی با استفاده از منحنی roc.
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه مازندران - دانشکده علوم پایه 1391
  موسی قهرمانزاده باروق   افشین فیاز موقر

‎نمودار ‎‎مشخصه عملکرد سیستم roc)‎) با‎ ‎توجه‎ به عملکرد درست و اشتباه سیستم ‏(روش یا دسته بندی کننده)، کارایی ‎‎آن را ‎‎‎‎‎‎‎ نشان می ‎‎دهد. عملکرد درست و اشتباه سیستم‏‎‏، با توجه به وضعیت مشاهدات در واقعیت و پیش بینی که سیستم برای مشاهدات انجام می دهد بدست می آید. پس با توجه به وضعیت مشاهدات در واقعیت و وضعیتی که دسته بندی کننده پیش بینی می کند یک جدول 2×2 می سازیم. از این جدول دو نسبت مثبت درست و مثبت اشتباه را به دست می آوریم یک نقطه در فضای roc معلوم می کند. با تغییر آستانه که وضعیت مشاهده را مشخص می کند منحنی roc ایجاد می شود که مساحت زیر آن کارایی روش را مشخص می کند. پس‎‎‎‎‎‎ می توان روش ها را با توجه به کارایی که از roc‎‎ به دست می آید مقایسه کرد.‎‎ مقایسه توالی های زیستی و پیدا کردن میزان شباهت یکی از‎‎ موضوعات مهم در علم بیوانفورماتیک است. برای پی بردن به ارتباط عملکرد و ساختار تکامل پروتئین ها و ‎‎‎dna‎ ها، توالی آنها با هم مقایسه می شود. تا شباهت و ارتباط بین آنها پیدا شود. ‎‎‎blast‎‎ نام یک نرم افزار کاربردی در علوم سلولی و مولکولی و ژنتیک است که مخفف واژگان ‎ابزار پایه ای برای جستجوی هم ترازی محلی است‎.‎‎‎‎ با این نرم افزار می توان توالی ‎‎زیستی را با هم مقایسه کرد. و درجه ای از شباهت را با عددی مشخص می کند. این نرم افزار به پژوهشگر اجازه می دهد تا یک توالی را با توالی دیگر یا توالی که در پایگاه داده وجود دارد، مقایسه کند. شناسایی توالی های موجود در پایگاه داده که بیشترین شباهت را با توالی مورد نظر دارد از دیگر قابلیت های این نرم افزار است. ‎‎ ‎‎‎ blast یکی از پرکاربردترین نرم افزارها در بیوانفورماتیک است که با الگوریتم ابتکاری و با استفاده از روش های بر پایه برنامه ریزی پویا با سرعت مطلوب مقایسه های مورد نظر را انجام می دهد. روش ‎‎‎h-tuple‎ یک روش جدید برای مقایسه دو توالی زیستی با شکاف است که معنی داری آماری برای شباهت دو توالی مشخص می کند. در این روش حروف توالی به گروهای ‎‎‎h‎‎ تایی‏، تقسیم می گردد و‎‎‎ بصورت شیفتی‎‎‎(انتقال) گروه ها رو به روی هم قرار می گیرند و برای حروف داخل گروه ‎ها‎‏، امتیاز سراسری با شکاف محاسبه می شود. ‎سپس در هر شیفت برای امتیازی که از گروه ها بدست آمده امتیاز‎ محلی بدون شکاف‏ به دست می آ‎‎ید و با استفاده از روش مرسیر و دودین معنی داری آماری محاسبه می شود. در این پایان نامه روش های فوق را بر روی تعدادی توالی اجرا می کنیم و با استفاده از ‎‎‎‎roc‎‎ کارایی آنها را مقایسه می کنیم. نتایج نشان داد که روش ‎‎‎‎h-tuple‎‎ دارای کارایی بهتری می باشد.