نام پژوهشگر: زهرا ماهور
زهرا ماهور محمدحسین سرایی
مبحث بین رشته ای بیوانفورماتیک شامل دستاوردهای نظری و عملی علوم کامپیوتر، ریاضی و بیولوژی بوده و در برگیرنده طراحی سیستم های کامپیوتری و مدل های ریاضی برای نگهداری، مدیریت و تحلیل مجموعه عظیمی از داده های زیستی و همچنین ارایه دانش زیستی می باشد. یکی ازاهداف اصلی تحقیقات ژنتیکی امروزی کشف ارتباطات عملکردی موجود بین ژنوتیپ ها(اطلاعات موروثی و رمزهای ژنتیکی) و فتوتیپ ها(بیماری ژنتیکی) است. تشخیص متغیر های مسبب یک فنوتیپ و الگو های عملکردی آن ها می تواند به سرعت موجب تشخیص و پیشگیری بسیاری از بیماری های ژنتیکی شده و درک بیوشیمی این قبیل بیماری ها را افزایش دهد، این مبحث مکان-یابی ژن ها نام دارد. در طی سال های اخیر، به روش های داده کاوی در مکان یابی ژنی توجه زیادی شده است که دلیل آن عدم موفقیت روش های قدیمی برای بیماری های پیچیده و همچنین افزایش امکان پیدا کردن همزمان چندین نشانگر است. روش های داده کاوی با استفاده از مکان یابی "عدم تعادل پیوند" به سه دسته روش های رده بندی، روش های خوشه کردن و روش های بر مبنای کشف الگوهای هاپلوتیپ تقسیم بندی می شوند. روش های رده بندی سعی می کنند مجموعه مکان هایی در ژنوتیپ برگزینند که به بهترین وجه فنوتیپ را پیشگویی کنند. اما ممکن است این مکان ها بصورت تصادفی انتخاب شوند. در این تحقیق برای اینکه فرایند رده بندی افراد بیمار و سالم بهبود داده شود ابتدا بوسیله روش hapminer، مجموعه نشانگرهای مهم پیدا می شود سپس از روی این نشانگرها مدلسازی با استفاده از روش درخت های تصمیم گیری و رگرسیون (cart) انجام می شود. برای نشان دادن کاربرد عملی تحقیق این روش روی داده های بیماری دیابت نوع اول اعمال شد. با اعمال مدلسازی بر مجموعه نشانگرهای مهم در هاپلوتیپ های افراد جمعیت نسبت به مدلسازی برروی تمام نشانگرها افزایش دقت مدلسازی و پیشگویی حاصل شد. روش های مکان یابی ژنی بر اساس تحلیل خوشه بندی هاپلوتیپ به طور گسترده ای برای مکان یابی جهش در توالی ژن استفاده شده-اند. در خیلی از موارد، مکان پیدا شده بر اساس این روش ها خطای بزرگی دارند. در این تحقیق، یک تکنیک جدید برای کاهش خطای مکان یابی ژنی رابطه ای در تحلیل خوشه بندی هاپلوتیپ ارایه شده است. در این روش بهره اطلاعات برای انتخاب مجموعه ویژگی های مهم(نشانگرها) برای استفاده در گام بعدی که فرایند خوشه بندی است، استفاده می شود. به عبارت دیگر، به هر نشانگر یک رتبه اختصاص داده می شود و سپس نشانگرهای با رتبه بالا به الگوریتم hapminer برای مکان یابی بیماری به عنوان ورودی داده می شود. بازدهی این تکنیک روی داده شبیه سازی شده بررسی شده است. آزمایشات عملی انجام شده در این تحقیق کاهش محسوس در خطای میانگین در مکان یابی ژنی را نشان می دهد.