طبقه‏بندی داده‌های نامتوازن در تشخیص اولیه بیماری‌های پستان با روش‌های آدابوست، شبکه عصبی احتمالی و K تا نزدیک‏ترین همسایه

Authors

  • الفت بخش, آسیه
  • اویسی, فرید
  • علوی, نسرین
  • هاشمی, عصمت
  • گرگین, سعید
Abstract:

چکیده مقدمه: سرطان پستان یکی از سرطان‏های شایع در ایران بوده و هرگونه اقدام تشخیصی به هنگام در این­ مورد می‏تواند جان بسیاری از مبتلایان به این سرطان را نجات بخشد. هدف از این پژوهش طبقه­بندی داده­های نامتوازن مربوط به بانوان مراجعه‏کننده به کلینیک پژوهشکده سرطان پستان جهاددانشگاهی به منظور تعیین وضعیت ایشان و طبقه­بندی نرمال و یا غیرنرمال بودن پستان مراجعه‏کنندگان بود. مجموعه داده­های نامتوازن یکی از چالش­های پیش روی طراحی سیستم­های پزشک‏یار برای طبقه­بندی و تعیین وضعیت بیمار محسوب می‏شود که در این پژوهش از روش­های سطح داده برای حل آن استفاده شد. روش بررسی: در این مطالعه برای طبقه­بندی داده­های 918 نفر، سه الگوریتم AdaBoost.M1، k تا نزدیک­ترین همسایه و شبکه عصبی احتمالی به خدمت گرفته شد. از آنجا که داده­های این مطالعه نامتوازن بود، برای حل این مساله از روش بیش نمونه‏برداری تصادفی کلاس اقلیت، زیرنمونه برداری تصادفی کلاس اکثریت و بیش نمونه‏برداری مصنوعی کلاس اقلیت استفاده شد. به منظور پیاده‏سازی الگوریتم­ها از امکانات و ابزارهای نرم­افزار «متلب» و «آر» استفاده گردید. همچنین برای ورودی الگوریتم­های طبقه­بندی از 60 متغیر مندرج در کاربرگ­­­های شرح حال و معاینه فیزیکی مراجعان استفاده شد. معیارهای دقت و F-measure به منظور ارزیابی در مرحله آزمون الگوریتم­ها مورد استفاده قرار گرفت.  یافته‏ها: بر اساس معیارهای دقت و F-measure، بهترین عملکرد الگوریتم­های سه­گانه این مطالعه در مواجهه با مجموعه داده تولیدشده با روش بیش نمونه‏برداری مصنوعی کلاس اقلیت بود. در این راستا عملکرد الگوریتم­های AdaBoost.M1، k تا نزدیک­ترین همسایه و شبکه عصبی احتمالی در مواجهه با مجموعه داده مذکور و بر اساس معیارهای دقت و F-measure به ترتیب عبارتند از: 5/93 و 6/93، 5/79 و 7/87 و 86 و 9/91 بدست آمد. نتیجه‏گیری: روش­های مختلفی برای حل مساله عدم توازن مجموعه داده­ها به منظور طبقه­بندی وجود دارد؛ نمونه­گیری مجدد که از روش­های سطح داده محسوب می­شود یکی از متداول­ترین آنهاست. از سه روش نمونه­گیری مجددی که در این مطالعه استفاده شد، بهترین عملکرد طبقه‏بندها در مواجهه با مجموعه داده ایجاد شده در نتیجه نمونه­گیری مجدد به روش بیش نمونه‏برداری مصنوعی کلاس اقلیت بود. از بین الگوریتم­های به خدمت گرفته شده و بر اساس معیارهای دقت و F-measure بهترین عملکرد در تمامی مجموعه داده­های این مطالعه متعلق به الگوریتم AdaBoost.M1 بود.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

طبقه‏بندی داده های نامتوازن در تشخیص اولیه بیماری های پستان با روش های آدابوست، شبکه عصبی احتمالی و k تا نزدیک‏ترین همسایه

چکیده مقدمه: سرطان پستان یکی از سرطان‏های شایع در ایران بوده و هرگونه اقدام تشخیصی به هنگام در این­ مورد می‏تواند جان بسیاری از مبتلایان به این سرطان را نجات بخشد. هدف از این پژوهش طبقه­بندی داده­های نامتوازن مربوط به بانوان مراجعه‏کننده به کلینیک پژوهشکده سرطان پستان جهاددانشگاهی به منظور تعیین وضعیت ایشان و طبقه­بندی نرمال و یا غیرنرمال بودن پستان مراجعه‏کنندگان بود. مجموعه داده­های نامتوازن ...

full text

ارزیابی روش غیرپارامتریک k- نزدیکترین همسایه و سیستم‌های شبکه عصبی مصنوعی برای برآورد هدایت هیدرولیکی اشباع خاک

هدایت هیدرولیکی اشباع خاک از مهم ترین ویژگی های فیزیکی خاک است لیکن در بیشتر موارد به علت محدودیت‌های عملی و یا هزینه‌ای، اندازه‌گیری آن با دشواری همراه است. در این پژوهش مدل‌های مختلف شبکه های عصبی مصنوعی با نوعی از الگوریتم‌های غیرپارامتریک از نوع یادگیرنده‌های تنبل موسوم به k-نزدیکترین همسایه، برای تخمین هدایت هیدرولیکی اشباع خاک از روی داده‌های سهل‌الوصول خاک، مورد مقایسه قرار گرفت. در این ...

full text

پیاده سازی سیستم تصمیم یار مبتنی بر شبکه عصبی احتمالی جهت تشخیص نوع سرطان پستان

چکیده مقدمه: سرطان پستان رایج‌ترین شکل سرطان در زنان است. تشخیص به‌موقع سرطان شانس زنده ماندن بیمار را افزایش می‌دهد. شبکه‌های عصبی مصنوعی از روش‌های نوین مدل‌سازی و پیش‌بینی هستند. هدف از این مطالعه تشخیص خوش‌خیم یا بدخیم بودن توده‌های سرطان پستان است که برای این منظور سیستم تصمیم‌یار مبتنی بر شبکه عصبی احتمالی طراحی شد. روش بررسی: در این مطالعه یک شبکه عصبی احتمالی طراحی شد که بر اساس متغیره...

full text

مدل‌سازی جریان رودخانه باراندوزچای با استفاده از روش‌ نزدیکترین K- همسایه و روش‌های هوشمند

پیش­بینی دقیق جریان رودخانه در طراحی، بهره­برداری و برنامه­ریزی منابع آب از اهمیت بسزایی برخوردار است. در این مطالعه، عملکرد روش­های ناپارامتری نزدیکترین همسایه، فازی- عصبی تطبیقی و روش رگرسیون بردار پشتیبان در پیش­بینی جریان رودخانه ارزیابی شده است. برای مدل­سازی از داده­های جریان 36 ساله ایستگاه هیدرومتری دیزج واقع بر رودخانه باراندوزچای (در مقیاس زمانی ماهانه) استفاده گردید. ترکیبات مختلفی ا...

full text

مدل سازی جریان رودخانه باراندوزچای با استفاده از روش نزدیکترین k- همسایه و روش های هوشمند

پیش­بینی دقیق جریان رودخانه در طراحی، بهره­برداری و برنامه­ریزی منابع آب از اهمیت بسزایی برخوردار است. در این مطالعه، عملکرد روش­های ناپارامتری نزدیکترین همسایه، فازی- عصبی تطبیقی و روش رگرسیون بردار پشتیبان در پیش­بینی جریان رودخانه ارزیابی شده است. برای مدل­سازی از داده­های جریان 36 ساله ایستگاه هیدرومتری دیزج واقع بر رودخانه باراندوزچای (در مقیاس زمانی ماهانه) استفاده گردید. ترکیبات مختلفی ا...

full text

پیاده سازی سیستم تصمیم یار مبتنی بر شبکه عصبی احتمالی جهت تشخیص نوع سرطان پستان

چکیده مقدمه: سرطان پستان رایج ترین شکل سرطان در زنان است. تشخیص به موقع سرطان شانس زنده ماندن بیمار را افزایش می دهد. شبکه های عصبی مصنوعی از روش های نوین مدل سازی و پیش بینی هستند. هدف از این مطالعه تشخیص خوش خیم یا بدخیم بودن توده های سرطان پستان است که برای این منظور سیستم تصمیم یار مبتنی بر شبکه عصبی احتمالی طراحی شد. روش بررسی: در این مطالعه یک شبکه عصبی احتمالی طراحی شد که بر اساس متغیرها...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 9  issue 2

pages  7- 18

publication date 2016-09

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023