نام پژوهشگر: نرجس خاتون حبیبی
نرجس خاتون حبیبی محمدحسین سرایی
بیوانفورماتیک علمی است بین رشته ای که قواعد ریاضی، فیزیک، شیمی و علوم کامپیوتر را به داده های وسیع، متنوع و پیچیده زیست شناسی، اعمال می کند. هدف بیوانفورماتیک، حل مسایل زیست شناسی در سطح مولکولی است. پروتیین ها از اجزای اصلی سلول های موجودات زنده هستند. هر مولکول پروتیین، از زنجیره ای از اسیدهای آمینه تشکیل می شود. برای پروتیین چهار ساختار (اول، دوم، سوم، چهارم) تعریف شده است. ساختار اول، همان زنجیره اسیدهای آمینه آن است. ساختارهای دوم، ساختارهای محلی هستند که توسط برقراری پیوندهای ییدروژنی به وجود می آیند. رایج ترین آن ها، مارپیچ های آلفا و صفحه های بتا هستند. ساختار سوم، شکل کلی یک مولکول پروتیین و در واقع، موقعیت فضایی ساختارهای دوم نسبت به یکدیگر است که در اثر تاشدن زنجیره اسید آمینه شکل می گیرد. ساختار چهارم از تجمع چندین پروتیین ایجاد می گردد. محققان، پیوسته پروتیین های جدیدی کشف و توالی اسیدهای آمینه آن ها را تعیین می کنند. عمل پروتیین، وابسته به شکل ساختار سوم آن است. مولکول هایی که یک پروتیین می تواند به آن ها متصل شود، بستگی به شکل سه بعدی پروتیین دارند. ساختار سوم خود، وابسته به توالی اسید آمینه است. متاسفانه، تعیین ساختار سوم، به سادگی تعیین ساختار اول پروتیین نیست. روش های فعلی تعیین ساختار سوم، بسیار پر هزینه و زمان بر هستند. در نتیجه محققان بر روی روش هایی کار می کنند که بتوانند ساختار سوم پروتیین را صرفا بر اساس توالی اسید آمینه آن پیش بینی نمایند. پیش بینی نقشه تماس، یکی از این روش هاست. با داشتن نقشه تماس، می توان ساختار سوم را پیش بینی نمود. نقشه تماس پروتیین، یک نمایش ساده شده و دوبعدی از ساختار فضایی پروتیین است. هدف در مساله پیش بینی نقشه تماس، محاسبه تقریبی نقشه تماس یک پروتیین با استفاده از توالی اسید آمینه آن و ویژگی هایی است که صرفا از روی توالی قابل محاسبه و یا پیش بینی هستند. رویکردهای آماری و یادگیری ماشین متعددی برای پیش بینی نقشه تماس ارایه شده است. ماشین گروهی، یک روش یادگیری ماشین است که در آن وظیفه یادگیری میان چند یادگیر و فضای ورودی به چند زیرفضا تقسیم می شود. پاسخ یادگیرها به یک ورودی، به نحوی با یکدیگر ترکیب شده و پاسخ نهایی سیستم را تشکیل می دهند. این پاسخ، دقیق تر از پاسخ هر یک از یادگیرهاست. هدف این تحقیق، ارایه یک روش نوین پیش بینی نقشه تماس بر اساس ایده ماشین گروهی است. گروه یادگیر در روش پیشنهادی، مجموعه ای از شبکه های عصبی است. ویژگی هایی متعددی برای آموزش سیستم استخراج می شوند. سپس یک گروه از شبکه های عصبی به عنوان مدل پیش بینی کننده ایجاد می گردد. معیار مهم در ارزیابی پیش بینی نقشه تماس، نسبت تماس های درست پیش بینی شده به تعداد کل تماس های پیش بینی شده است. برای تحلیل نتایج مدل پیشنهادی، دو روش دیگر نیز پیاده سازی و نتایج آن ها مقایسه شده است. نتایج، نشان دهنده کارایی روش ماشین گروهی در مسیله پیش بینی نقشه تماس است.