بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء

Authors

  • منصور فاتح دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
Abstract:

امروزه آشکارسازی و برچسب‎زنی اشیاء در تصاویر یکی از چالش‎های اساسی در برخی از کاربردهای بینایی‎ماشین می‎باشد. در سال‎های اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکه‎های عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می‌شود. در ادامه شبکه‎ای بهبود یافته از شبکه R-FCN ارائه می‎شود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسب‎زنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسب‎زنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

R-FCN: Object Detection via Region-based Fully Convolutional Networks

We present region-based, fully convolutional networks for accurate and efficient object detection. In contrast to previous region-based detectors such as Fast/Faster R-CNN [7, 19] that apply a costly per-region subnetwork hundreds of times, our region-based detector is fully convolutional with almost all computation shared on the entire image. To achieve this goal, we propose position-sensitive...

full text

R-FCN-3000 at 30fps: Decoupling Detection and Classification

We present R-FCN-3000, a large-scale real-time object detector in which objectness detection and classification are decoupled. To obtain the detection score for an RoI, we multiply the objectness score with the fine-grained classification score. Our approach is a modification of the R-FCN architecture in which position-sensitive filters are shared across different object classes for performing ...

full text

Degenerate Four Wave Mixing in Photonic Crystal Fibers

In this study, Four Wave Mixing (FWM) characteristics in photonic crystal fibers are investigated. The effect of channel spacing, phase mismatching, and fiber length on FWM efficiency have been studied. The variation of idler frequency which obtained by this technique with pumping and signal wavelengths has been discussed. The effect of fiber dispersion has been taken into account; we obtain th...

full text

اینترنت اشیاء؛ سامانه‌ای برای بهبود نظام آموزش عالی

امروزه فناوری‌های اطلاعاتی، فرایندهای تولید، توزیع و بهره‌گیری از دانش را تحت تأثیر قرار داده‌اند. در این میان، اینترنت اشیاء به عنوان شبکه‌ای از انواع اشیاء متصل به هم می‌تواند ظرفیت‌های جدیدی را در همه عرصه‌‌ها ایجاد نماید. هدف پژوهش حاضر، بررسی نقش و کارکرد اینترنت اشیاء در فرایندهای تولید، انتقال و کاربرد دانش در نظام آموزش عالی است. بدین منظور از رویکرد سیستمی و روش SSM چکلاند که یک روش تح...

full text

معرفی شبکه های عصبی پیمانه ای عمیق با ساختار فضایی-زمانی دوگانه جهت بهبود بازشناسی گفتار پیوسته فارسی

In this article, growable deep modular neural networks for continuous speech recognition are introduced. These networks can be grown to implement the spatio-temporal information of the frame sequences at their input layer as well as their labels at the output layer at the same time. The trained neural network with such double spatio-temporal association structure can learn the phonetic sequence...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 6  issue 2

pages  43- 59

publication date 2020-02-20

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023