نام پژوهشگر: نجمه تقی زاده
نجمه تقی زاده منصور ابراهیمی
ویروس هپاتیت سی یکی از شایع ترین علل نارسایی مزمن کبد و پیوند کبد در جهان محسوب می شود. تقریباٌ 3 درصد جمعیت جهان یعنی بیش از 170 میلیون نفر آلوده به این ویروس هستند. ویروس هپاتیت سی دارای 6 ژنوتیپ است که احتمال پاسخ به درمان در بیماران بسته به ژنوتیپ ابتلایی متفاوت است. در روش های درمانی حال حاضر تنها برای 40% از افرادی که به ژنوتیپ 1 مبتلا شده اند پاسخ مثبت می دهد. همچنین 80% از افرادی که به ژنوتیپ 2 مبتلا هستند به این درمان پاسخ مثبت می دهند و علاوه بر هزینه های گزاف درمان، از نظر روانی نیز تاثیر مخربی بر امید به آینده بیماران دارد. تشخیص ژنوتیپ مورد ابتلا قبل از درمان به عنوان یک گزینه مهم مد نظر محققان قرار گرفته است. در این تحقیق ما بر آنیم که بر اساس ساختار ژنی یا توالی نوکلئوتیدی هر ژنوتیپ و با استفاده از ابزارهای داده کاوی و طراحی شبکه های عصبی هوشمند، مشخصه های متمایز کننده بین ژنوتیپ های ویروس هپاتیت در سطح نوکلئوتیدی را مشخص نموده که بتوان قدم بسیار موثری در این زمینه ایفا نماییم. برای تحقق این مهم با جمع آوری پایگاه داده مناسب، پیش پردازش ها و استفاده از الگوریتم های مختلف وزندهی، 11 پایگاه داده مناسب فراهم شد که با اجرای الگوریتم های دسته بندی نظیر k-means و k-mediods به دسته بندی مناسب دست یافته و با استفاده از روش های یادگیری ماشین همچون درخت تصمیم، الگوریتم بیزین، ماشین بردار پشتیبان و شبکه عصبی، بهترین پایگاه داده روی بهترین مدل به جهت تشخیص نوع ژنوتیپ تعیین شد. در نهایت با استفاده از مدلهای مختلف شبکه عصبی و پیاده سازی آن در نرم افزار rapidminer بهترین مدل در نرم افزار matlab طراحی شد، که آن مدل شبکه عصبی چند لایه پرسپترون (mlp) با 2 لایه مخفی است، که با خطای 0.5% در تعیین ژنوتیپ 1 و 2 ویروس هپاتیت سی عمل می کند.