دسته بندی پروتئین ها با استفاده از روش های کرنل و خواص شیمیایی آمینواسیدها

پایان نامه
چکیده

پروتئین ها نقش مهمی در بسیاری از فرآیندهای حیاتی ایفا می کنند. پروتئین ها مولکول های پیچیده ای هستند که از توالی بیست آمینواسید مختلف تشکیل یافته اند. ساختار اول در پروتئین ها همین توالی خطی آمینواسید های خاص در آنها می باشد. دانستن ساختار و کار پروتئین ها دارای کاربرد های مختلفی نظیر طراحی دارو، تشخیص بیماری و حتی بهبود کیفیت محصولات و سوخت های حیاتی مصنوعی می باشد. امروزه با پیشرفت های اخیر در زمینه ی ترادف یابی شاهد رشد نمائی در اطلاعات دنباله های پروتئینی بوده ایم. ساختارهای پروتئینی عمدتا توسط پراش پرتو ایکس و طیف بینی تشدید مغناطیسی هسته تعیین می شوند. اما این روش ها وقت گیر، پرهزینه و غیرقابل کاربرد در مورد تمامی پروتئین ها می باشند. در غیاب اطلاعات ساختاری در مورد پروتئین ها تحلیل دنباله های پروتئینی، منبع اصلی اطلاعات در مورد بسیاری از پروتئین های جدید می باشد. در بسیاری از موارد شباهت دنباله های پروتئینی منجر به عملکرد مشابه یا مرتبط می شود. در طول سال های گذشته الگوریتم ها و روش های یادگیری ماشین مختلفی برای دسته بندی پروتئین ها پیشنهاد شده است. از جمله این روش ها، روش های کرنل می باشند. ایده اصلی در روش های کرنل نگاشت داده های ورودی به یک فضای برداری با ابعاد معمولا بالاتر و سپس یافتن یک جداساز مناسب در این فضا می باشد. روش های کرنل جز روش های دنباله محور در دسته بندی پروتئین ها می باشند. به این معنی که الگوریتم مورد نظر به طور مستقیم بر روی توالی خطی آمینواسیدهای تشکیل دهنده ی یک دنباله ی پروتئینی عمل می کند. رهیافت دیگری که برای دسته بندی پروتئین ها می توان در نظر گرفت، استفاده از یک نگاشت برای انتقال دنباله های پروتئینی به یک فضای برداری و سپس اعمال یک الگوریتم دسته بندی در این فضای جدید می باشد. روش مبتنی بر استفاده از ترکیب شبه آمینواسیدی برای دنباله های پروتئینی، جز روش های این دسته می باشد، که در نگاشت به فضای برداری از خواص بیوشیمیایی آمینواسیدهای تشکیل دهنده ی دنباله ی پروتئینی استفاده می کند. در این پایان نامه به مسئله ی دسته بندی پروتئین ها با استفاده از روش های کرنل و همچنین استفاده از خواص شیمیایی آمینواسیدها به عنوان ویژگی جهت یادگیری ماشین پرداخته شده است. از بین روش های کرنل موجود در زمینه ی دسته بندی پروتئین ها چهار روش کرنل طیفی، کرنل عدم تطبیق، کرنل شکاف دار و نیز کرنل ترازیابی محلی پیاده سازی شده اند. روش مبتنی بر استفاده از ترکیب شبه آمینواسیدی نیز به طور کامل پیاده سازی و نتایجش با روش های کرنل مقایسه شده است. جهت ارزیابی روش های مورد بررسی، از چهار خانواده ی پروتئینی استفاده شده است. نتایج بیانگر کارایی هر دو روش کرنل و نیز روش مبتنی بر استفاده از ترکیب شبه آمینواسیدی، بسته به خانواده ی مورد بررسی می باشد. به عبارت دقیق تر از بین روش های کرنل، کرنل ترازیابی محلی دارای کارایی بهتری نسبت به سایر روش های کرنل می باشد. روش مبتنی بر استفاده از ترکیب شبه آمینواسیدی نیز، در مورد دو خانواده پروتئینی نتایج بهتری از کرنل ترازیابی محلی داشته است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارزیابی رفتار دینامیکی خاک ‏های ریزدانه با استفاده از الگوریتم دسته ‏بندی گروهی داده‏ ها

با توجه به اینکه عملکرد صحیح تأسیسات زیربنایی نیاز به طراحی دقیق دارد، بنابراین ارزیابی دقیق پارامترهای کلیدی با به ‏کارگیری روش­ های نوین از اهمیت ویژه­ ای برخوردار است. در سازه ­های خاکی و سیستم ­های حمل و نقل، به ­عنوان بخشی از مهم ترین ابنیه ­ی فنی و زیرساخت­ ها که خدماتی ضروری برای بشر فراهم می ­نمایند، همواره برآورد و پیش­بینی دقیق ­تر رفتار خاک، بخصوص در برابر بارهای دینامیکی، بسیار اهمی...

متن کامل

پیشگویی پیوند در شبکه های اجتماعی با استفاده از ترکیب دسته بندی کننده ها

Abstract Link prediction in social networks is one of the most important activities in analysis of such networks. The importance of link prediction in social networks is due to its dynamic nature. While members and their relationships (links) in such networks are continuously increasing, links may be missed due to various reasons. By predicting such links, the possibility of extension, compl...

متن کامل

دسته بندی پرسش ها با استفاده از ترکیب دسته بندها

هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

دسته بندی اهداف سوناری با استفاده از روش ترکیبی ازدحام ذرات و جستجوی گرانشی

با توجه به خصوصیات فیزیکی بسیار نزدیک اهداف واقعی و کلاترِ سونار فعال، تفکیک این اهداف، از موضوعات چالش‌برانگیز محققان و صنعت‌گران حوزه آکوستیک می‌باشد. شبکه‌های عصبی چندلایه (MLP) یکی از پرکاربردترین شبکه‌های عصبی در دسته‌بندی اهداف دنیای واقعی هستند. آموزش از مهمترین بخش‌های توسعه این نوع شبکه ها است که در سال‌های اخیر بسیار مورد توجه قرار گرفته است. به منظور آموزش شبکه‌های MLP از دیر باز استف...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023