نام پژوهشگر: علیرضا خان تیموری
محمد باقر قجه لو علیرضا خان تیموری
افزایش زیاد داده های زیستی در پایگاه های اطلاعاتی بیوانفورماتیکی همراه با ظهور تحقیقات مبتنی بر کامپیوتر در زیست شناسی، منجر به مدل سازی سیستم های زیستی بر اساس داده های آزمایشگاهی مشاهده شده و حل مسائل زیستی در سطح کل سیستم گردید. این مدل ها برای شبیه سازی و پیش بینی پارامترهای مورد نظر و مجهول مورد استفاده قرار می گیرند. پیش بینی عملکرد پروتئین (pfp) از طریق مدل سازی داده های عملکردی در دسترس مربوط به پروتئین ها، یکی از مهم ترین حوزه های مطالعاتی در زیست شناسی سامانه ای (systems biology) است. پروتئین ها پلیمرهایی هستند که از 20 نوع آمینواسید مختلف ساخته شده اند. آن ها نقش های مهمی در سیستم های زنده بر عهده دارند، از جمله می توان به نقش های ساختاری، اندام زایی، کاتالیز واکنش های بیوشیمیایی مورد نیاز برای متابولیسم و کاتابولیسم اشاره نمود. مجموعه داده بزرگی شامل شبکه تعاملی بین پروتئین ها مهم ترین معیار برای پیش بینی عملکرد پروتئین است. مدل های pfp فعلی با در نظر گرفتن شبکه تعاملی به عنوان یک عنصر دوحالته (وجود یا عدم وجود میانکش) ساخته شده اند. راهکارهای متفاوتی از قبیل روش های همسایگی، بهینه سازی کلی و خوشه بندی دارای مزایا و محدودیت های خاص خود هستند. هدف این مطالعه افزایش دقت pfp با استفاده از دو روش پیشنهادی است. در اولین روش که بر مبنای نظری گراف است، شبکه به کلیک هایی با اندازه متفاوت تقسیم می شود. در مرحله بعد کلیک های بدست آمده بر مبنای عملکرد اعضای خود مورد تجزیه وتحلیل قرار می گیرند. برای نسبت داده عملکرد به پروتئین های دارای عملکرد نامعلوم، همسایه های آن ها در شبکه مورد ارزیابی قرار گرفته و عملکرد آن ها بر اساس کلیک والد پیش بینی می شوند. مرحله نهایی شامل تعیین تعداد عملکردهای قابل اختصاص دادن است که از طریق مشخص کردن میانگین تعداد عملکردهای پروتئین های مجاور بدست می آید. در روش دوم که در برگیرنده الگوریتم جدیدی نیست، تلاش نمودیم تا به برخی سوالات پیرامون تعدادی از داده های قابل استفاده و در دسترس در مقالات علمی به منظور دستیابی به شبکه کامل و تجمیع شده پاسخ دهیم. برای به کارگیری این شبکه ابتدایی ترین الگوریتم به کار گرفته شد. نتایج بدست آمده بیانگر این است که هر دو روش پیشنهادی دارای دقت و کارآیی بالاتر نسبت به روش های دیگر هستند.