انتخاب ویژگی مبتنی بر تئوری اطلاعات برای انتخاب ژن‌های مؤثر در تشخیص نوع سرطان با استفاده از داده‌های ریزآرایه

نویسندگان

  • راضیه شیخ‌پور گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه اردکان، اردکان، ایران
  • محمدرضا پژوهان گروه مهندسی کامپیوتر، پردیس فنی و مهندسی، دانشگاه یزد، یزد، ایران
  • ولی درهمی گروه مهندسی کامپیوتر، پردیس فنی و مهندسی، دانشگاه یزد، یزد، ایران
چکیده مقاله:

انتخاب ویژگی یکی از فرایندهای پیش پردازش داده‌ها در مباحث مربوط به یادگیری ماشین و داده‌کاوی محسوب می‌شود که در برخی زمینه‌ها نظیر کار با داده‌های ریزآرایه در بیوانفورماتیک که با مشکل ابعاد بالای داده‌ها در مقابل تعداد کم نمونه‌ها مواجه است، از اهمیت ویژه‌ای برخوردار است. انتخاب ویژگی‌های (ژن‌های) موثر در تشخیص بیماری از داده‌های ریزآرایه نقش مهمی در تشخیص زودهنگام بیماری و راه‌های مواجهه با آن ایفا می‌کند. در روش‌های انتخاب ویژگی مبتنی بر تئوری اطلاعات که طیف گسترده‌ای از روش‌های انتخاب ویژگی را شامل می‌شوند، از مفهوم آنتروپی برای تعریف معیارهای مرتبط بودن، افزونگی و مکمل بودن ویژگی‌ها، استفاده می‌شود. در این مقاله از مفهوم پیوستگی خالص به جای آنتروپی (پراکندگی) برای پیشنهاد یک معیار جدید مرتبط بودن استفاده شده است. در معیار پیشنهادی، برای کنترل و کاهش افزونگی، ارتباط یک ویژگی با تک‌تک کلاس‌ها به طور جداگانه بررسی شده است در حالی‌که در اکثر روش‌های فیلتر، ارزش یک ویژگی بر اساس ارتباط آن با کل کلاس‌ها سنجیده می‌شود. این راهکار باعث می‌شود که ویژگی‌های (ژن‌های) موثر در هر کلاس به تفکیک شناسایی شوند، در حالی‌که امکان شناسایی ویژگی‌های (ژن‌های) مشترک نیز فراهم است. مشکل دیگری که در برخی روش‌ها وجود دارد، مسئله گسسته‌سازی داده‌ها است. در روش ارائه شده، با استفاده از یک تبدیل مبتنی بر یک‌ریختی ضمن استفاده از مزایای گسسته‌سازی از درگیر شدن با پیچیدگی‌های آن اجتناب شده است. برای مقایسه روش ارائه شده با تعدادی از روش‌های مرتبط ، از هفت مجموعه داده ریزآرایه مربوط به انواع سرطان به همراه سه دسته‌بند پرکاربرد بیزین ساده، -kنزدیک‌ترین همسایه و ماشین بردار پشتیبان استفاده شده است. نتایج تجربی، کارایی روش ارائه شده را بر اساس دو پارامتر دقت دسته‌بندی و تعداد ژن‌های انتخابی نشان می‌دهد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارزیابی تأثیر انتخاب ویژگی و توابع کرنل مختلف در عملکرد SVM برای تشخیص سرطان پستان

مقدمه: سرطان پستان یکی از رایج‌ترین سرطان‌ها در میان زنان است. در تصاویر ماموگرافی، تشخیص تومورهای خوش‌خیم از بدخیم به دلیل شباهت ساختاری کاری دشوار و زمان‌بر است. یادگیری ماشین یک شاخه از هوش مصنوعی است که می‌تواند به صورت ابزاری کمکی در کنار پزشک قرار گیرد و آن‌ها را در تصمیم‌گیری یاری کند. ماشین بردار پشتیبان SVM یکی از رایج‌ترین روش‌های یادگیری ماشین است که عملکرد آن به نوع تابع کرنل و ویژگ...

متن کامل

یک روش جدید برای انتخاب ویژگی مبتنی بر منطق فازی

چکیده: انتخاب ویژگی یکی از چالش برانگیز ترین و از مهمترین فعالیت‌ها در توسعه یادگیری ماشین و تشخیص الگوست. معیارهای ارزیابی ویژگی نقش بسیار مهمی برای ساخت یک الگوریتم انتخاب ویژگی دارند. در این مقاله یک معیار انتخاب ویژگی اصلاح شده با استفاده از منطق فازی برای انتخاب تعداد ویژگی‌های مورد نیاز ارائه می شود. این معیار به شکل غیر فازی در تحقیقات قبلی استفاده می‌شود، اما در این مقاله با تعریف تعداد...

متن کامل

ارزیابی تأثیر انتخاب ویژگی و توابع کرنل مختلف در عملکرد SVM برای تشخیص سرطان پستان

مقدمه: سرطان پستان یکی از رایج‌ترین سرطان‌ها در میان زنان است. در تصاویر ماموگرافی، تشخیص تومورهای خوش‌خیم از بدخیم به دلیل شباهت ساختاری کاری دشوار و زمان‌بر است. یادگیری ماشین یک شاخه از هوش مصنوعی است که می‌تواند به صورت ابزاری کمکی در کنار پزشک قرار گیرد و آن‌ها را در تصمیم‌گیری یاری کند. ماشین بردار پشتیبان SVM یکی از رایج‌ترین روش‌های یادگیری ماشین است که عملکرد آن به نوع تابع کرنل و ویژگ...

متن کامل

ارائه ی چارچوبی مبتنی بر تئوری بازیها برای انتخاب ویژگی

انتخاب یک زیر مجموعه ی مناسب از ویژگیهای داده ها که به منظوری خاص مانند طبقه بندی صورت پذیرد، یک امر بسیار مهم در تمامی مسائل می باشد. در این پایان نامه روشی عملی برای انتخاب ویژگی پیشنهاد شده که روی انواع داده ها به جوابهای مناسبی می رسد. بدین منظور محیط مسأله به صورت یک بازی تک نفره معرفی شده است و با استفاده از روش های مونت کارلو و تفاوت زمانی که از روشهای بسیار کارای الگوریتم یادگیری تقویت...

ارائه روش های مبتنی بر تئوری گراف برای انتخاب ویژگی

با پیشرفت های به وجود آمده در جمع آوری داده و قابلیت های ذخیره سازی در طی دهه های اخیر مجموعه های داده ای با ابعاد بالا در علوم مختلف به سرعت در حال افزایش هستند. بسیاری از این مجموعه های داده ای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگی ها اغلب نامرتبط و دارای افزونگی هستند که منجر به کاهش عملکرد الگوریتم های طبقه بندی می شوند. از این رو انتخاب ویژگی، برای کاهش...

15 صفحه اول

انتخاب ویژگی های موثر در تشخیص سرطان پستان با استفاده از مدل های پارامتریک یادگیری ماشین

چکیده مقدمه: آزمایش آسپیراسیون سوزنی روشی کم هزینه، آسان و سریع برای تشخیص دقیق و زود هنگام سرطان پستان است. با استفاده از خصوصیات استخراج شده از آزمایش آسپیراسیون سوزنی و با کمک تکنیک های یادگیری ماشین می توان سیستمی کارآمد را برای تشخیص سرطان پستان طراحی نمود که با دقت بالایی خوش خیم یا بدخیم بودن تومورهای پستان را تشخیص دهند. هدف از انجام این مطالعه، انتخاب ویژگی های موثر در تشخیص سرطان پستا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 13  شماره 4

صفحات  331- 340

تاریخ انتشار 2019-12-22

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023