نام پژوهشگر: منیره دباغچیان
سودابه غفوری وایقان میرهادی سیدعربی
برای دستیابی به تعامل طبیعی انسان و کامپیوتر، دست انسان می تواند به عنوان یک رابط استفاده شود. حرکات و اشاره های دست کانال ارتباطی قدرتمندی بین انسان هاست که بخش اصلی انتقال اطلاعات در زندگی روزانه را تشکیل می دهد. اما ردگیری و تشخیص حرکات دست به دلیل پیچیدگی حرکات دست و درجه های آزادی زیادی که دست دارد، یک مسئله چالش انگیز است. از طرف دیگر الگوریتم های بینایی ماشین به طور آشکاری ضعیف و حساس هستند. در این پژوهش از یک معماری دولایه ای برای تشخیص حرکات دست استفاده شده است که در لایه پایین آن برای حل مشکل تشخیص ضعیف حالت های دست، یک سری ویژگی های شبه هار جدید ارائه شده است. این ویژگی ها مشکل اصلی ویژگی های شبه هار را که نرخ خطای بالای آنها در کلاس بندی حالت های دست است، کاهش می دهد. همچنین راه کار دوم ارائه شده، استفاده از ترکیب ویژگی های شبه هار و هیستوگرام گرادیان جهت دار است. ایده بنیادی، استفاده از مزیت های هر کدام از ویژگی ها در تشخیص حالت های دست و بالا بردن نرخ تشخیص و کم کردن خطای مثبت کاذب است. برای کلاس بندی از الگوریتم یادگیری آدابوست که می تواند با ساختار آبشاری سرعت اجرا را بالا ببرد، استفاده شده است. برای کلاس بندی نهایی حالت های دست، الگوریتم یادگیری ماشین های بردار پشتیبان چند کلاسه آموزش یافته با ویژگی های هیستوگرام گرادیان جهت دار استفاده شده است. همچنین برای مقاوم کردن سیستم در برابر پس زمینه های پیچیده و همچنین افزایش سرعت، از آشکارسازی ناحیه پوستی استفاده شده است. در لایه بالا تشخیص حرکات دست انجام می شود. در این لایه با استفاده از گرامر های مستقل از متن تصادفی، ساختار نحوی حرکات دست تحلیل می شوند. ساختار نحوی حرکات با تبدیل حالت های آشکار شده و تشخیص داده شده از لایه پایین به رشته ها، ایجاد می شود. یک رشته ورودی که مطابق با حرکات دست است می تواند با اندازه گیری شباهت ها و احتمالات تخصیص داده شده به هر قانون و جست وجو کردن قانونی که بیشترین احتمال را برای آن رشته ورودی تولید می کند تشخیص داده شود.
سیده نگار مظلومی میرهادی سیدعربی
خوشهبندی ابزاری مهم در بسیاری از کاربردها به منظور گردآوری دادهها در خوشهها یا گروهها است. خوشهبندی، دادهها را به نواحی مختلف معنیدار تقسیم میکند. خوشهبندی در تصویر که تصویر را به زیرناحیههای معنیدار تقسیم میکند مرحلهای ضروری در پردازش تصویر است. الگوریتم رقابت استعماری، یک الگوریتم بهینهسازی برگرفته از تکامل اجتماعی-سیاسی است. در این پایاننامه با ایجاد تغییراتی در این الگوریتم، الگوریتمی جهت خوشهبندی تصویر با نام الگوریتم امپراطوریهای خوشهبند در تصاویر رنگی (ccia) ارائه میشود. الگوریتم ارائهشده با افزودن عملگری با نام "عملگر ادغام"، بهبود مییابد. الگوریتمهای ارائهشده هم قابلیت اجرا روی تصاویر سطوح خاکستری و هم تصاویر رنگی را دارند، آنچه در این پایاننامه به آن پرداختهایم، خوشهبندی تصویر رنگی است. در پایان، نتایج حاصل از دو الگوریتم ارائهشده روی یک تصویر ساختهشده و یک تصویر واقعی با یکدیگر مقایسه میشوند. بهعنوان نمونه خطای ccia در تصویری ساختهشده در 200 نسل 80487/36 و خطای الگوریتم بهبودیافته 50198/0 است همچنین در 6800 نسل خطای ccia 81227/3 و الگوریتم بهبودیافته 0004/0 است. زمان مصرفی الگوریتم بهبودیافته به میزان کمی از زمان مصرفی ccia بیشتر است. بهعنوان نمونه، در تصویری ساختهشده در 200 نسل زمان ccia 20491/0 و زمان الگوریتم بهبودیافته 69779/0 و در 6800 نسل زمان ccia 88686/4 و زمان الگوریتم بهبودیافته 97576/4 است. نتایج حاکی از کارایی الگوریتم بهبودیافته در خوشهبندی تصاویر رنگی دارد.
امیرحسین نظرعلیان بهزاد مظفری تازه کند
چکیده رشد سریع چند رسانه ای دیجیتالی و فناوریهای اینترنت یکی از زمینههای بزرگ تحقیقات امروزی است که در این راستا مشکلاتی از قبیل حق انتشار محصولات دیجیتالی به وجود آمده است و سالانه باعث از دست رفتن میلیاردها دلار برای تولیدکنندگان میشود. برای حل این مشکل، یکی از شیوههای ارایه شده مبحث نهاننگاری است که عاملی برای جلوگیری و پیگیری حق انتشار غیر قانونی محصولات دیجیتالی است. تحقیقات و شیوه های زیادی برای نهان نگاری ارایه شده است. شیوه های رایج امروزی حوزه هایی از قبیل صوت و تصویر را در بر می گیرند و برای هرکدام یک روش جدا و یا اینکه برای هر دو یک روش ترکیبی ارایه می دهند. طیف گسترده روشی مخابراتی است که در اواسط دهه 80 میلادی ارتش امریکا آن را غیر نظامی اعلام کرد و در نتیجه کاربردهای تجاری نیز پیدا کرد. این روش توان سیگنال ارسالی را در یک طیف فرکانسی پخش می نماید و در برابر تداخل و همچنین نویزپذیری پایداری بالایی دارد. طیف گسترده مخابراتی به دو روش دنباله مستقیم و پرش فرکانسی استفاده می شود. هدف اصلی این تحقیق، ارایه روشی برای ترکیب نهان نگاری با طیف گسترده می باشد. کدهای نهان نگاری به وسیله طیف گسترده در اطلاعات اصلی اولیه پخش می شود به نحوی که هر کد چندین تکرار از خود را درجاهای متفاوتی از اطلاعات اولیه قرار می دهد. بنابراین خروجی حاصل از نهان نگاری ترکیبی، در برابر نویز مقاومت بیشتری نشان می دهد و تخریب کمتری خواهد داشت. در این تحقیق، چگونگی این ترکیب، نحوه ی بکارگیری و کاربرد آن بیان خواهد شد.
مرتضی محمدی قراسویی میرهادی سید عربی
هدف از محاوره انسان و کامپیوتر، رسیدن به محاوره ای شبیه به کار انسان با انسان در مورد انسان با کامپیوتر می باشد. ژست ها نقش مهمی را در زندگی روزانه انسان ها جهت انتقال اطلاعات و بیان احساسات بازی می کنند. ژست ها پیامدی از حرکت بخشی از بدن می باشند که یکی از این حرکت های بسیار پرکاربرد حرکت دست می باشد که به عنوان ژست پویای دست شناخته می شود. بنابراین دنبال کردن دست و تشخیص حرکت آن بسیار مهم بوده و می تواند کاربردهای همه منظوره ای را فراهم کند. در این پایاننامه چارچوبی برای تشخیص ژست های ایزوله و ژست های پویای دست پیشنهاد شده است که از فیلتر کالمن جهت دنبال کردن دست و از مدل مخفی مارکوف جهت تشخیص حرکت دست استفاده شده است. همچنین فرض شده است که فرد در جلوی دوربین فاصله خود را تغییر نداده و دوربین فیلمبرداری ثابت بوده و هیچ حرکتی ندارد. در این چارچوب جهت تشخیص ژست های پویای دست از اعداد و حروف انگلیسی استفاده شده است. برای تشخیص از ویژگی زاویه با دو تقسیم بندی 20 و 45 درجه استفاده شده است. در ژست های پویا جهت کشف و تشخیص از اعداد انگلیسی استفاده شده است. به طور کلی ژست های پویای دارای دو نوع ژست معنی دار (اصلی) و بیمعنی می باشند. این ژست ها در دنباله ویدیویی باید تفکیک شوند. جهت تشخیص ژست های معنی دار می بایست آنها را در دنباله ویدیویی کشف کرد. به همین منظور جهت کشف ژست های معنی دار از یک روش ابتکاری استفاده شده است که با استفاده از آن نقطه شروع و پایان ژست معنی دار در دنباله ویدیویی مشخص می شود. پس از مشخص شدن نقطه شروع و پایان ژست معنی دار، مسیر بین این دو نقطه جهت تشخیص به مدل مخفی مارکوف داده می شود تا ژست پویای انجام شده، کلاس بندی شود. چارچوب پیشنهادی، کارایی خوبی را در کشف و تشخیص ژست های پویا نشان می دهد. همچنین این سیستم از نظر پیچیدگی محاسباتی بسیار مناسب بوده به طوری که هدف کاهش هزینه های محاسباتی در نظر گرفته شده است و در صحنه های پیچیده توانمندی مناسبی را فراهم میکند.
فاطمه سروش میرهادی سید عربی
یکی از پیچیده ترین کار ها در پردازش تصاویر دیجیتال، بخش بندی تصاویر است. به دلیل افزایش توجه به این تکنیک توسط محققان و تبدیل آن به یک نقش حیاتی در بسیاری از زمینه های کاربردی مثل کاربرد های پزشکی مورد استفاده قرار می گیرد.
منیره دباغچیان مسعود گراوانچی زاده
چکیده ندارد.