شناسایی حرکات انسان در داده های ویدئویی با استفاده از روشهای یادگیری نیمه نظارتی

پایان نامه
چکیده

شناسایی حرکت انسان در داده های ویدئویی به عنوان یک موضوع پژوهشی مهم در حوزه بینایی ماشین، توجه بسیاری از محققان را به خود جلب کرده است. استخراج اطلاعات حرکتی انسان در ویدئو سبب کشف الگوهای مفید می شود که توسط آن ها می توان به طبقه بندی و خوشه بندی داده های ویدئویی پرداخت. بازشناسی و فهم خودکار اعمال انسان یک نیاز رو به افزایش در حوزه های کاربردی مهمی نظیر سیستم های امنیتی و نظارتی به ویژه در مکان های شلوغ و با اهمیت مانند مترو و فرودگاه است. یافتن راهکار های دقیق و در عین حال سریع برای بدست آوردن پیش زمینه، بدست آوردن ویژگی های ممیز و کم بودن تعداد ویدئوهای برچسب دار از جمله چالش های پیش روی این مسئله است که در این پژوهش به آنها توجه شده است. در این پژوهش یک روش با نام rhmad مبتنی بر نوع حرکت با استفاده از مدل کدبوک و با رویکرد یادگیری نیمه نظارتی، برای شناسایی حرکت انسان ارائه شده است. در این روش ابتدا میزان جابجایی در حرکت انسان مشخص شده و سپس با استفاده از این ویژگی حرکات به دو دسته تقسیم می شوند: حرکات با جابجایی انسان و حرکات بدون جابجایی انسان. پس از آن هر نوع حرکت توسط روش مربوط به آن نوع حرکت دسته بندی می شود. به طور کلی روش های پیشنهادی برای شناسایی حرکات انسان در قسمت پیش-پردازش به علت استفاده از مدل کدبوک علاوه بر ساده سازی و کاهش مراحل پردازش، به اطلاعات مناسب تر و غنی تری دسترسی دارد و همچنین به دلیل جداسازی سیستم برای انواع مختلف حرکات(حرکات با جابجایی و حرکات بدون جابجایی) دارای دقت بالاتری است. این روش بر روی پایگاه داده های شناخته شده ی kth و weizmann آزمون گردیده است و به ترتیب دقت 47/93 و 2/89 حاصل شده است.

منابع مشابه

رخدادکاوی در داده های ویدئویی با استفاده از روش های یادگیری نیمه نظارتی

امروزه حجم زیادی از داده های ویدئویی در دسترس افراد است؛ داده های ویدئویی هم اکنون بیش از نیمی از ترافیک اینترنت را به خود اختصاص داده اند. سالانه 9000ساعت محصولات سینمایی و 8 میلیون ساعت محصولات تلویزیونی تولید می شود، این در حالی است که پیش بینی می شود تا سال 2014 بیش از 90% ظرفیت شبکه جهانی اینترنت به انتقال داده های ویدئویی اختصاص یابد. برای دسترسی کارا به این حجم عظیم داده، نیاز شدیدی به ا...

15 صفحه اول

یادگیری نیمه نظارتی کرنل مرکب با استفاده از تکنیک‌های یادگیری معیار فاصله

Distance metric has a key role in many machine learning and computer vision algorithms so that choosing an appropriate distance metric has a direct effect on the performance of such algorithms. Recently, distance metric learning using labeled data or other available supervisory information has become a very active research area in machine learning applications. Studies in this area have shown t...

متن کامل

حاشیه‌نویسی تصویر با استفاده از الگوریتم خوشه‌بندی نیمه نظارتی طیفی

Abstract: Due to the growth of digital images require efficient methods to annotate the images is sense. In this paper, a semi-supervised spectral clustering with relevance feedback is used to annotate digital photos which is overcome the local minima problem on clustering methods by using some labeled information given by users. Performance of the proposed method is tested on Corel 5K dataset ...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

شناسایی حرکات ارادی انسان با استفاده از سیگنال های eeg

در این مطالعه کاربردی، کلاسه بندی پنج تصور ذهنی اندازه گیری شده توسط eeg بررسی و پیاده سازی خواهد شد. سیگنال های eeg در حوزه زمان دارای حجم بالائی هستند، و از این گذشته ممکن است این سیگنال ها حاوی مصنوعاتی باشند که از منابعی غیر از مغز ثبت شده باشند، از قبیل پلک زدن و یا حرکت چشم. بنابراین کاهش اطلاعات زائد و استخراج مفیدترین اطلاعات ضروری به نظر می رسد. در روش پیشنهادی از روش های کاهش ابعاد، ی...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023