نام پژوهشگر: فاطمه خوشخو
فاطمه خوشخو مهدی وثیقی
تجزیه و تحلیل و تفسیر توالی های زیستی در زمره مسائل مورد توجه در حیطه بیوانفورماتیک است. عملکرد پروتئین ها وابسته به ساختار فضایی آن هاست. به عبارت دیگر می توان گفت که ساختار سه بعدی یک پروتئین ، خاصیت های عملکردی پروتئین را تعیین می کند. به منظور بررسی عملکرد پروتئین دانشمندان سعی در پیش بینی ساختار سه بعدی پروتئین از توالی اسید آمینه ی آن دارند. علی رغم مطالعات گسترده در زمینه ی ساختار پروتئین ها، تعیین ساختار سه بعدی پروتئین کماکان کار مشکلی است. با توجه به این موضوع که اسیدهای آمینه توسط رشته ای از کاراکترها نشان داده می شوند، لازمه پیش بینی ساختار پروتئین های جدید، تبدیل اسیدهای آمینه به فرمت عددی است. در این پژوهش، برای توصیف دنباله های پروتئین، از یک توصیف مبتنی بر استخراج ویژگی به نام k-mer استفاده شده است. به طور خاص برای هر توالی پروتئین، یک بردار ??? مولفه ای ایجاد می گردد. این رویکرد جدید به دلیل در نظر گرفتن همزمان ترتیب، تعداد حضور وفاصله ی آمینو اسیدها، اطلاعات بیشتری جهت طبقه بندی ساختار پروتئین ها استخراج می نماید و به طراحی مدلی دقیق تر جهت کلاس بندی منجر می گردد. به منظور طبقه بندی پروتئین ها با استفاده از اطلاعات ساختار اول از شبکه عصبی مصنوعی xy-fused استفاده شده است. این نوع شبکه عصبی مصنوعی برپایه ی نوعی از نقشه های خودسازمانده بوده که از توانایی بالایی جهت یادگیری نظارتی (طبقه بندی داده ها) برخوردار می باشد. روش پیشنهادی بر روی یکی از چالش برانگیزترین مجموعه داده ها اعمال گردید و صحت طبقه بندی توالی های بیولوژیکی توسط معتبرسازی متقاطع در حدود ??? بدست آمد که در مقایسه با سایر روش های پیشنهادی جهت آنالیز این داده ها بهبود قابل توجهی مشاهده گردید.