بررسی و بهبود روش های رده بندی در تصاویر ویدئویی به منظور تشخیص مفاهیم معنایی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
- نویسنده مرجان ممتازپور
- استاد راهنما محمد حسین سرایی مازیار پالهنگ
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1389
چکیده
با رشد روزافزون داده ها (از قبیل متن، صوت و تصویر) نیاز به نمایه گذاری، جستجو، سازمان دهی و دسته بندی خودکار داده ها افزایش یافته است. بیشتر این داده ها، داده های چندرسانه ای، شامل صوت و تصویر هستند. یکی از مهمترین مسائل در سال های اخیر، تشخیص مفاهیم معنایی است. هدف اصلی در تشخیص مفاهیم معنایی تعیین حضور مفهوم معنایی خاصی مانند «خارج ساختمان»، « هواپیما»، »خودرو» و «انسان» در قاب های ویدئویی است. در گذشته، پیشرفت هایی در تشخیص مفاهیم معنایی در دامنه های مختلف گزارش شده است. رده بندی یکی از روش های متداول در حوزه تشخیص مفاهیم معنایی است. در حالیکه بسیاری از رده بندها می توانند برای این منظور استفاده شوند، svm متداول ترین آنهاست. رده بند های svm در مسائل رده بندی پیچیده خوب عمل می کنند. با اینحال، فاز یادگیری آنها مخصوصاً در مواردی که تعداد خصیصه ها زیاد است، فرآیندی زمان بر محسوب می شود. هر خصیصه اضافی، هزینه، حافظه مورد نیاز و زمان سیستم رده بندی را افزایش میدهد. به همین دلیل، محققان پردازش تصویر، تمایل دارند تا برای طراحی و پیاده سازی رده بندها از مجموعه خصیصه های کوچک استفاده کنند. با اینحال، به مجموعه ای مناسب از خصیصه ها برای بدست آوردن نرخ بازشناسی قابل قبول نیاز است. بنابراین، جستجو برای یافتن زیرمجموعه ای بهینه از خصیصه ها از میان مجموعه خصیصه های موجود، دارای اهمیت ویژه ای است. در تشخیص مفاهیم معنایی از طریق رویکردهای یادگیری ماشین، تعداد زیادی از خصیصه ها در کارهای گذشتگان در نظر گرفته می شد. اما، رده بندی بر اساس این تعداد زیاد از خصیصه ها نه تنها زمان رده بندی را افزایش می دهد بلکه می تواند باعث کاهش کارایی سیستم رده بند گردد. بنابراین، انتخاب خصیصه می تواند به عنوان راه حلی مناسب برای کم کردن تعداد خصیصه ها باشد. هدف این پایان نامه، بهبود رفتار رده بند از دیدگاه زمان و کارایی است. در این پایان نامه، قالب کاری جدیدی برای انتخاب مهمترین خصیصه ها از میان خصیصه های سطح پایین، که در رده بند های موجود استفاده می شوند، ارائه می گردد. این کار منجر به کاهش زمان یادگیری و رده بندی توسط خصیصه های انتخاب شده میشود. علاوه بر بهبود زمان رده بند، کارایی رده بند نیز قابل قبول خواهد بود. بدین منظور از الگوریتم ژنتیک برای انتخاب خصیصه استفاده می شود. بعد از انتخاب خصیصه، رده بندهای پایه برای تشخیص وجود مفاهیم معنایی در ویدئو آموزش داده می شوند. به علاوه، از ترکیب برای بهبود کارایی رده بندهای پایه استفاده می شود. در مرحله ترکیب، از خصیصه های انتخاب شده (توسط روش ارائه شده) استفاده می شود و با روش های ترکیب پیشین مقایسه می گردد. نتایج شبیه سازی ها نشان می دهند که با پالایش خصیصه های نا مربوط، معیارهای ارزیابی کارایی رده بند مخصوصا میانگین ظرافت (ap) بهبود می یابند. ظرافت، فراخوانی، دقت، f-score و ویژگی معیارهای کارایی دیگری هستند که در شبیه سازی ها اندازه گیری شده اند.
منابع مشابه
بررسی امکان تشخیص گونه های درختی در تصاویر هوایی رقومی به روش طبقه بندی شیءـ پایه
دادههای سنجش از دور، بهویژه تصاویر هوایی رقومی با توان تفکیک مکانی و رادیومتری زیاد، میتواند ابزار مناسبی برای شناسایی گونههای درختی باشد. هدف از این تحقیق بررسی قابلیت این تصاویر و روش شیءـپایه برای تشخیص گونههای درختی است. به این منظور منطقهای 86/5 هکتاری از پارک طالقانی تهران انتخاب شد. تصاویر دوربین UltraCam-D چهارباندی ادغامشده با باند پانکروماتیک با پیکسلهایی به ابعاد 7×7 سان...
متن کاملارائه یک روش ترکیبی به منظور استخراج و ردیابی عوارض متحرک در فریم تصاویر ویدئویی جلونگر مادون قرمز
استخراج و ردیابی عوارض در تصاویر ویدئویی بهعنوان یک موضوع کلیدی در مباحث بینایی کامپیوتری محسوب میگردد، و میتواند بهعنوان چشمانداز کارهای سطوح پایینتر برای رسیدن به سطوح بالاتر استفاده گردد. در سالهای اخیر، روشهای گوناگونی به منظور استخراج و تشخیص عوارض در فریم تصاویر مادون قرمز بهخصوص در زمینههای پایش، نظارت و امنیت پدیدهها پیشنهاد شده است. با این وجود، استخراج و ردیابی عوارض متحرک ...
متن کاملبررسی امکان تشخیص گونه های درختی در تصاویر هوایی رقومی به روش طبقه بندی شیءـ پایه
دادههای سنجش از دور، بهویژه تصاویر هوایی رقومی با توان تفکیک مکانی و رادیومتری زیاد، میتواند ابزار مناسبی برای شناسایی گونههای درختی باشد. هدف از این تحقیق بررسی قابلیت این تصاویر و روش شیءـپایه برای تشخیص گونههای درختی است. به این منظور منطقهای 86/5 هکتاری از پارک طالقانی تهران انتخاب شد. تصاویر دوربین ultracam-d چهارباندی ادغامشده با باند پانکروماتیک با پیکسلهایی به ابعاد 7×7 سان...
متن کاملارائه یک روش ترکیبی به منظور استخراج و ردیابی عوارض متحرک در فریم تصاویر ویدئویی جلونگر مادون قرمز
استخراج و ردیابی عوارض در تصاویر ویدئویی به عنوان یک موضوع کلیدی در مباحث بینایی کامپیوتری محسوب می گردد، و می تواند به عنوان چشم انداز کارهای سطوح پایین تر برای رسیدن به سطوح بالاتر استفاده گردد. در سال های اخیر، روش های گوناگونی به منظور استخراج و تشخیص عوارض در فریم تصاویر مادون قرمز به خصوص در زمینه های پایش، نظارت و امنیت پدیده ها پیشنهاد شده است. با این وجود، استخراج و ردیابی عوارض متحرک ...
متن کاملآنالیز تصاویر چهره به منظور تشخیص خواب آلودگی
تشخیص خواب آلودگی در موارد زیادی از جمله کاهش تصادفات جاده ای اهمیت دارد. در این مقاله، الگوریتم های جدیدی به منظور تعیین مکان مردمک ها و دایره های عنبیه، لب ها و تشخیص وضعیت باز و بسته بودن چشم ها ارائه می شود که در نهایت بر اساس آنالیز چهره (باز و بسته بودن چشم ها و دهان) میزان سطح خواب آلودگی فرد تعیین می شود. در بیشتر روش های مبتنی بر آنالیز چهره با استفاده از یک پارامتر، خواب آلودگی فرد تش...
متن کاملتحلیل تصاویر ریزآرایه به منظور تشخیص نوع سرطان سینه
Background: Microarray technology is a powerful tool to study and analyze the behavior of thousands of genes simultaneously. Images of microarray have an important role in the detection and treatment of diseases. The aim of this study is to provide an automatic method for the extraction and analysis of microarray images to detect cancerous diseases. Methods: The proposed system consists of t...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023