بهبود تخمین و تحلیل داده های ریزآرایه به کمک انتخاب ویژگی و خوشه بندی طیفی شبکه های شباهت ژن

پایان نامه
چکیده

حجم انبوه داده¬هایی که امروزه در آزمایشگاه¬های علوم تجربی حاصل می¬شوند، به زعم وجود تکنیک¬ها و متد¬های آزمایشگاهی پیشرفته، برای تحلیل، نیاز مبرم به روش¬های محاسباتی دارند. استنتاج منطقی روابط پیچیده¬ای که بین داده¬ها از نظر مفهوم زیستی و کاربردشان در آن حیطه وجود دارد، بدون وجود روش¬های آماری و الگوریتم¬های کامپیوتری بسیار سخت و تقریبا غیر ممکن به نظر می¬رسد. از طرفی ریاضیات محض نیز بدون حضور مفاهیمی که در پشت مجموعه داده نهفته است، اینکه این داده¬ها طی چه فرآیند¬هایی استخراج شده¬اند و در چه مکانیزم¬هایی در سلول شرکت کرده¬اند، نمی¬تواند کارگشا باشد. لذا "بیوانفورماتیک" با هدف ترکیب آگاهانه این دو زمینه شکل گرفته¬است. ریزآرایه¬ها یکی از اساسی ترین تکنولوژی¬های تولید داده هستند که تحلیل درست¬ داده¬های حاصل از آن¬ها پاسخ¬دهنده بسیاری از سوالات کلیدی زیست¬شناسان خواهد بود. در این پایان نامه با هدف تخمین داده های مفقود در خروجی این دستگاه، پس از انتخاب ژن¬های منتخب، ابتدا یک روش خوشه بندی با عنوان خوشه بندی طیفی با معیار شباهت ضریب همبستگی پیرسون برای مجموعه داده سرطان خون معرفی می¬کنیم. نتیجه این خوشه¬بندی با روش¬های دیگر به کمک منحنی مشخصه عملکرد سیستم مقایسه می شود. پس از آن الگوریتم sllsimpute، الگوریتم معروف برای تخمین داده مفقود، روی هرکدام از خوشه¬ها به طور مجزا اجرا شده و نتایج با الگوریتم های دیگر تخمین داده مفقود مقایسه می¬شود. نتایج آزمایشگاهی نشان می¬دهد که روش پیشنهادی بر حسب جذر میانگین مربع خطا دارای کارایی قابل قبول، نسبت به سایر روش¬ها می¬باشد.

منابع مشابه

تاثیر انتخاب ویژگی به کمک الگوریتم ژنتیک بر طبقه بندی طیفی مکانی تصاویر ابرطیفی

فن‌آوری سنجش از دور ابرطیفی دارای کاربردهای فراوان در طبقه­بندی پوشش‌های زمین و بررسی تغییرات آنها می‌باشد. با پیشرفت‌های اخیر و ایجاد تصاویری با قدرت تفکیک مکانی بالا، لزوم استفاده توام از اطلاعات طیفی و مکانی را در طبقه­ بندی تصاویر ابرطیفی ایجاب می‌کند. در این تحقیق سعی می‌گردد تاثیر کاهش ابعاد به کمک الگوریتم ژنتیک را در فرآیند طبقه­ بندی طیفی-مکانی تصاویر ابرطیفی بررسی شود. در میان الگوریت...

متن کامل

انتخاب ژن و طبقه بندی سلول های سرطانی بر پایه داده های ریزآرایه با استفاده از الگوریتم ترکیبی BPSO و BLDA

داده های ریزآرایه در تشخیص و طبقه بندی انواع بافت های سرطانی نقش بسزایی دارند. در پژوهش های سرطان همیشه تعداد نسبتا کم نمونه ها در ریزآرایه باعث ایجاد مشکلاتی در طراحی طبقه بندها شده است. بنابراین داده های ریزآرایه قبل از طبقه بندی از طریق تکنیک های انتخاب ژن پیش پردازش و ژن های فاقد اطلاعات آن ها دور ریخته می شود. اساسا یک روش انتخاب ژن مناسب می تواند بطور موثر کارایی دسته بندی بیماری ها (سرطا...

متن کامل

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

متن کامل

تشخیص خودکار خوشه های میکروکلسیفیکاسیون به کمک تبدیل موجک و شبکه های عصبی

در این مقاله، یک سیستم CAD به منظور شناسایی و تشخیص خوشه های میکروکلسیفیکاسیون در تصاویر ماموگرافی معرفی شده است. الگوریتم معرفی شده مرکب از سه مرحله اساسی است. در مرحله اول، تبدیل موجک روی تصاویر ماموگرافی اعمال شده و دو ضریب موجک به همراه دو ویژگی آماری به عنوان ویژگی های متمایز کننده پیکسل ها از نظر تعلق به یک دانه میکروکلسیفیکاسیون استخراج می گردد. سپس با استفاده از یک شبکه عصبی، دسته بندی ...

متن کامل

بهبود روش تحلیل پوششی داده ها به منظور خوشه بندی مشتریان اعتباری بانک ها

رقابت بین مدیران سازمان های صنعتی و خدماتی برای تامین نیازهای مالی و اعتباری خود از طریق دریافت تسهیلات بانکی به صورت روزانه در حال افزایش است. از طرف دیگر منابع مالی و اعتباری بانک‌ها و موسسات مالی برای ارائه تسهیلات به متقاضیان محدود می‌باشد. بر این اساس تخصیص بهینه منابع محدود مالی با هدف حداکثر نمودن ارزش سرمایه گذاری برای آنها یک ضرورت می-باشد. در این تحقیق پس از شناسایی معیارهای اعتباردهی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه تربیت معلم - تهران - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023