طبقهبندی دادههای نامتوازن در تشخیص اولیه بیماریهای پستان با روشهای آدابوست، شبکه عصبی احتمالی و K تا نزدیکترین همسایه
Authors
Abstract:
چکیده مقدمه: سرطان پستان یکی از سرطانهای شایع در ایران بوده و هرگونه اقدام تشخیصی به هنگام در این مورد میتواند جان بسیاری از مبتلایان به این سرطان را نجات بخشد. هدف از این پژوهش طبقهبندی دادههای نامتوازن مربوط به بانوان مراجعهکننده به کلینیک پژوهشکده سرطان پستان جهاددانشگاهی به منظور تعیین وضعیت ایشان و طبقهبندی نرمال و یا غیرنرمال بودن پستان مراجعهکنندگان بود. مجموعه دادههای نامتوازن یکی از چالشهای پیش روی طراحی سیستمهای پزشکیار برای طبقهبندی و تعیین وضعیت بیمار محسوب میشود که در این پژوهش از روشهای سطح داده برای حل آن استفاده شد. روش بررسی: در این مطالعه برای طبقهبندی دادههای 918 نفر، سه الگوریتم AdaBoost.M1، k تا نزدیکترین همسایه و شبکه عصبی احتمالی به خدمت گرفته شد. از آنجا که دادههای این مطالعه نامتوازن بود، برای حل این مساله از روش بیش نمونهبرداری تصادفی کلاس اقلیت، زیرنمونه برداری تصادفی کلاس اکثریت و بیش نمونهبرداری مصنوعی کلاس اقلیت استفاده شد. به منظور پیادهسازی الگوریتمها از امکانات و ابزارهای نرمافزار «متلب» و «آر» استفاده گردید. همچنین برای ورودی الگوریتمهای طبقهبندی از 60 متغیر مندرج در کاربرگهای شرح حال و معاینه فیزیکی مراجعان استفاده شد. معیارهای دقت و F-measure به منظور ارزیابی در مرحله آزمون الگوریتمها مورد استفاده قرار گرفت. یافتهها: بر اساس معیارهای دقت و F-measure، بهترین عملکرد الگوریتمهای سهگانه این مطالعه در مواجهه با مجموعه داده تولیدشده با روش بیش نمونهبرداری مصنوعی کلاس اقلیت بود. در این راستا عملکرد الگوریتمهای AdaBoost.M1، k تا نزدیکترین همسایه و شبکه عصبی احتمالی در مواجهه با مجموعه داده مذکور و بر اساس معیارهای دقت و F-measure به ترتیب عبارتند از: 5/93 و 6/93، 5/79 و 7/87 و 86 و 9/91 بدست آمد. نتیجهگیری: روشهای مختلفی برای حل مساله عدم توازن مجموعه دادهها به منظور طبقهبندی وجود دارد؛ نمونهگیری مجدد که از روشهای سطح داده محسوب میشود یکی از متداولترین آنهاست. از سه روش نمونهگیری مجددی که در این مطالعه استفاده شد، بهترین عملکرد طبقهبندها در مواجهه با مجموعه داده ایجاد شده در نتیجه نمونهگیری مجدد به روش بیش نمونهبرداری مصنوعی کلاس اقلیت بود. از بین الگوریتمهای به خدمت گرفته شده و بر اساس معیارهای دقت و F-measure بهترین عملکرد در تمامی مجموعه دادههای این مطالعه متعلق به الگوریتم AdaBoost.M1 بود.
similar resources
طبقهبندی داده های نامتوازن در تشخیص اولیه بیماری های پستان با روش های آدابوست، شبکه عصبی احتمالی و k تا نزدیکترین همسایه
چکیده مقدمه: سرطان پستان یکی از سرطانهای شایع در ایران بوده و هرگونه اقدام تشخیصی به هنگام در این مورد میتواند جان بسیاری از مبتلایان به این سرطان را نجات بخشد. هدف از این پژوهش طبقهبندی دادههای نامتوازن مربوط به بانوان مراجعهکننده به کلینیک پژوهشکده سرطان پستان جهاددانشگاهی به منظور تعیین وضعیت ایشان و طبقهبندی نرمال و یا غیرنرمال بودن پستان مراجعهکنندگان بود. مجموعه دادههای نامتوازن ...
full textارزیابی روش غیرپارامتریک k- نزدیکترین همسایه و سیستمهای شبکه عصبی مصنوعی برای برآورد هدایت هیدرولیکی اشباع خاک
هدایت هیدرولیکی اشباع خاک از مهم ترین ویژگی های فیزیکی خاک است لیکن در بیشتر موارد به علت محدودیتهای عملی و یا هزینهای، اندازهگیری آن با دشواری همراه است. در این پژوهش مدلهای مختلف شبکه های عصبی مصنوعی با نوعی از الگوریتمهای غیرپارامتریک از نوع یادگیرندههای تنبل موسوم به k-نزدیکترین همسایه، برای تخمین هدایت هیدرولیکی اشباع خاک از روی دادههای سهلالوصول خاک، مورد مقایسه قرار گرفت. در این ...
full textپیاده سازی سیستم تصمیم یار مبتنی بر شبکه عصبی احتمالی جهت تشخیص نوع سرطان پستان
چکیده مقدمه: سرطان پستان رایجترین شکل سرطان در زنان است. تشخیص بهموقع سرطان شانس زنده ماندن بیمار را افزایش میدهد. شبکههای عصبی مصنوعی از روشهای نوین مدلسازی و پیشبینی هستند. هدف از این مطالعه تشخیص خوشخیم یا بدخیم بودن تودههای سرطان پستان است که برای این منظور سیستم تصمیمیار مبتنی بر شبکه عصبی احتمالی طراحی شد. روش بررسی: در این مطالعه یک شبکه عصبی احتمالی طراحی شد که بر اساس متغیره...
full textمدلسازی جریان رودخانه باراندوزچای با استفاده از روش نزدیکترین K- همسایه و روشهای هوشمند
پیشبینی دقیق جریان رودخانه در طراحی، بهرهبرداری و برنامهریزی منابع آب از اهمیت بسزایی برخوردار است. در این مطالعه، عملکرد روشهای ناپارامتری نزدیکترین همسایه، فازی- عصبی تطبیقی و روش رگرسیون بردار پشتیبان در پیشبینی جریان رودخانه ارزیابی شده است. برای مدلسازی از دادههای جریان 36 ساله ایستگاه هیدرومتری دیزج واقع بر رودخانه باراندوزچای (در مقیاس زمانی ماهانه) استفاده گردید. ترکیبات مختلفی ا...
full textمدل سازی جریان رودخانه باراندوزچای با استفاده از روش نزدیکترین k- همسایه و روش های هوشمند
پیشبینی دقیق جریان رودخانه در طراحی، بهرهبرداری و برنامهریزی منابع آب از اهمیت بسزایی برخوردار است. در این مطالعه، عملکرد روشهای ناپارامتری نزدیکترین همسایه، فازی- عصبی تطبیقی و روش رگرسیون بردار پشتیبان در پیشبینی جریان رودخانه ارزیابی شده است. برای مدلسازی از دادههای جریان 36 ساله ایستگاه هیدرومتری دیزج واقع بر رودخانه باراندوزچای (در مقیاس زمانی ماهانه) استفاده گردید. ترکیبات مختلفی ا...
full textپیاده سازی سیستم تصمیم یار مبتنی بر شبکه عصبی احتمالی جهت تشخیص نوع سرطان پستان
چکیده مقدمه: سرطان پستان رایج ترین شکل سرطان در زنان است. تشخیص به موقع سرطان شانس زنده ماندن بیمار را افزایش می دهد. شبکه های عصبی مصنوعی از روش های نوین مدل سازی و پیش بینی هستند. هدف از این مطالعه تشخیص خوش خیم یا بدخیم بودن توده های سرطان پستان است که برای این منظور سیستم تصمیم یار مبتنی بر شبکه عصبی احتمالی طراحی شد. روش بررسی: در این مطالعه یک شبکه عصبی احتمالی طراحی شد که بر اساس متغیرها...
full textMy Resources
Journal title
volume 9 issue 2
pages 7- 18
publication date 2016-09
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023