نام پژوهشگر: سجاد توسلی

تشخیص فعالیت انسان با استفاده از بهبود روش کیسه واژگان بصری
پایان نامه موسسه آموزش عالی روزبهان ساری - دانشکده کامپیوتر و فناوری اطلاعات 1392
  زینب آسوده نای   سجاد توسلی

بازشناسی فعالیت انسان، امروزه توجه بسیاری از محققین این رشته را به خود جلب نموده است. هدف چنین سیستمهایی ادراک فعالیت انسان، از روی تصاویر ویدویی است. در این پایان نامه روشی بر اساس مدل کیسه واژگان طراحی نمودیم. که سعی شده با اندکی تغییر در مدل کیسه واژگان آن را بهبود دهیم. ابتدا ویژگیهای مناسب با استفاده از توصیفگر hog/hof استخراج می شود، سپس با استفاده از یکی از الگوریتمهای یادگیری منوفیلد ابعاد آنها را کاهش داده و با استفاده از یکی از الگوریتمهای خوشه بندی فرهنگ واژگان از مجموع فریم های ویدویی ساخته می شود. در نهایت برای یادگیری سیستم بر اساس این مدل از بردار پشتیبان ماشین استفاده شده است. روش را روی پایگاه داده ویزمن تست کردیم. و نتایج حاصله حاکی از برتری این روش نسبت به روش مرتبط است.

شناسایی چهره با استفاده از کدگذاری تنک
پایان نامه موسسه آموزش عالی روزبهان ساری - دانشکده مهندسی کامپیوتر 1393
  مهری حبیب پور تهمتن   سجاد توسلی

شناسایی چهره با وجود کاربردهای گسترده و تحقیقات فراوان هنوز دارای مسائل حل نشده متعددی است.یکی از چالش¬های مهم برای دستیابی به یک سیستم شناسایی چهره کاربردی، تغییرات شدید ظاهر چهره است. مسئله مورد بررسی در این تحقیق، تشخیص صورت انسان با وجود تغییرات مختلف چهره از جمله :تغییرات روشنایی، حالات چهره،تخریب پیکسل¬ها و پوشیدگی می¬باشد.مسئله مهم در تشخیص استفاده از الگوریتمی مناسب برای طبقه بندی می¬باشد.بر این اساس تئوری جدید نمایش تنک مبتنی بر l 1-minimization به عنوان روشی برای طبقه بندی با وجود تمام محدودیت¬ها ،در این پایان نامه مطرح شده است. درطبقه بندی داده¬ها با ابعاد بالا چه از لحاظ تئوری و چه از لحاظ عملی ثابت می¬شود که تنکی کارایی بالایی دارد.با بهره گیری از مسائل پایه در زمینه پردازش تنک یک الگوریتم طبقه بند تنک را معرفی می¬کنیم که با وجود استفاده از ساده ترین نوع ویژگی¬ها یعنی نمونه برداری از پایین نسبت به تغییرات مختلف چهره مقاوم بوده ونسبت به روش¬های طبقه بندی رایج مثل نزدیکترین همسایه( nn ) عملکرد بهتری دارد. باپیاده سازی الگوریتم پیشنهادی بر روی پایگاه داده orl به دقت چشمگیر95 % رسیدیم .درپایان مقایسه ای بین الگوریتم پیشنهادی و الگوریتم نزدیکترین همسایه با وجود نویز و انسداد صورت می¬گیرد که مقاومت بالای این روش رانشان می¬دهد.

تشخیص فعالیت های غیرعادی انسان در سیستم های نظارت ویدئویی
پایان نامه موسسه آموزش عالی روزبهان ساری - دانشکده مهندسی برق و کامپیوتر 1393
  مجید مقدری امیری   سجاد توسلی

کنترل محدوده ها و اماکن تحت کنترل دوربین های مدار بسته هنگامی که با ازدحام زیاد جمعیت مواجه هستیم ( همچون مراکز خرید، استادیوم های ورزشی، راهپیمایی ها و مراسم های ملی و مذهبی و..) علاوه بر این که به نیروی انسانی زیادی در مرکز کنترل نیازمند می باشد به علت قدرت پردازش همزمان مشخص مغز انسان و شرایط ناشی از خستگی یا اشتباه انسانی می¬تواند با خطای بسیار همراه شود. لذا طراحی سیستمی که بدون خستگی، اشتباه، کوتاهی و با قدرت پردازش همزمان زیاد و بصورت بلادرنگ بتواند اعمال و فعالیتهای انسان¬ها را در محیط¬های حساس تحت نظارت کاملا هوشمند قرار دهد و فعالیتهای غیرعادی را شناسایی و نیروهای حفاظتی را آگاه نماید می¬تواند امنیت بهتری را برای انسان¬ها به همراه بیاورد. ما در این پژوهش، یک توصیف¬گر یکپارچه برای ویدئو به منظور استفاده در تشخیص فعالیت غیرعادی انسان معرفی می¬نماییم که قادر به تشخیص سریع فعالیتهای انسان حتی در محیط¬های غیرکنترلی و پیچیده باشد. توصیف¬گر ما با استفاده از یک بانک از فیلترهای فضایی-زمانی 3بعدی در طیف فرکانسی یک توالی ویدئویی ایجاد می¬شود. خاصیت پهنای باند عبوری این فیلترها، نیاز به انجام محاسبات پرهزینه برای محاسبه¬ی حرکت و تخمین وضعیت را کاهش می-دهد. همچنین این روش بر خلاف بسیاری از روش¬های متدوال دیگر، اطلاعات فضایی و زمانی را حفظ می¬نماید. آزمایش¬های صورت گرفته بر روی این روش پیشنهادی، برتری این روش را با توجه به معیارهای سرعت و دقت در مقایسه با روش¬های مشابه دیگر نشان می¬دهد.

بهبود دسته بندی تصاویر توسط چند دیکشنری مبتنی بر کدگذاری اسپارس
پایان نامه موسسه آموزش عالی روزبهان ساری - دانشکده کامپیوتر و فناوری اطلاعات 1393
  فرزانه نیرومند   سجاد توسلی

. یکی از چالش های مهم در این زمینه طبقه بندی تصاویر مشابهی که فقط در جزییات با یکدیگر تفاوت دارند می باشد . در این پژوهش ، به منظور بهبود تمایز در نمایش تصاویر و تسهیل دسته بندی تصاویر مشابه ، برای هر دسته یک دیکشنری مخصوص و برای تمام دسته ها ، یک دیکشنری مشترک پیشنهاد می شود و برای بهبود عملکرد در مرحله یادگیری دیکشنری از محدودیت های خود نا منسجمی و نا منسجمی متقابل استفاده شده است که تفاوت بین نمایش هر تصویر از دسته های متفاوت را پر رنگ تر می کند

تشخیص جعل ویدیو با استفاده از میزان نویز باقیمانده
پایان نامه موسسه آموزش عالی روزبهان ساری - دانشکده مهندسی کامپیوتر 1394
  سامان حبیبی   آرش موسوی درازمحله

روشی را در جهت پیدا کردن نواحی جعلی در ویدئوها، با استفاده از نویزهای باقی مانده در نواحی معرفی می کنیم. در این روش مقادیر همبستگی block-level نویزهای باقی مانده به عنوان یک ویژگی جهت کلاس بندی استخراج شده است.توزیع همبستگی نویز باقی مانده را در یک ویدئو جعلی به صورت یک مدل ترکیبی گوسی مدل می کنیم. جهت تخمین پارامترهای مدل به دو مرحله عملیات احتیاج داریم.