نام پژوهشگر: جمشید شنبه زاده
آرش زارع دستجردی رویا امجدی فرد
افزایش روزافرون مبادلات پولی الکترونیکی و نقش پررنگ کارت های پرداخت الکترونیکی در تسهیل این مبادلات و نوپابودن نحوه ی استفاده از این روش تبادل پولی، زمینه هایی را برای افراد متقلب و سودجو فراهم می آورد تا با استفاده از آشنایی کمتر کاربران با راهکارهای صحیح تبادل الکترونیک، اقدام به کلاهبرداری از مشتریان بانک ها و موسسات مالی کنند. در این تحقیق سعی شده است تا با استفاده از روش های استخراج الگو، رفتار مشتری در تعامل با بانک بررسی شده و نحوه خرج کردن مشتری و چگونگی عملیات برداشت از حساب وی با توجه به پارامترهای متفاوت استخراج شود و از الگوی استخراج شده برای هر مشتری، جهت بررسی صحت و تطابق تراکنش های جدید وی با الگوی رفتاری او استفاده شود. برای استخراج الگوی رفتاری مشتری، کاشف رفتاری هر مشتری از ترکیب مدل های مارکوف پنهان که هریک وظیفه ی تصمیم گیری براساس شرایط خاصی را دارند تشکیل شده است. به ازای هریک از مدل های مارکوف پنهان موجود در کاشفِ مختصِِ یک مشتری، میزان قابل اتکا بودن احتمال خروجی از آن به عنوان عاملی جهت بهبود دقت احتمال کل ( احتمال حاصل از ادغام نتایج) به کار می روند. با استفاده از این تقسیم بندی اختیارات و وظایف، میزان خطای کاشف کاهش پیداکرده همچنین صحت تطابق تراکنش جدید با تمامی حالات ممکن رفتاری مشتری مقایسه شده و درنهایت احتمال خروجی از کاشف به ازای تراکنش دارای میزان بالایی از قابلیت اتکا نسبت به سایر روش ها است.
مهرداد شمشکی رویا امجدی فرد
فرایند آشکارسازی چهره ، وجود چهره انسان در یک تصویر دلخواه را بررسی کرده و در صورت وجود آن، مکان چهره را می یابد. روشهای گوناگونی برای آشکارسازی چهره با استفاده از تحلیل ویژگی ها و روشهای مبتنی بر یادگیری ماشین ارائه شده است. علی رغم روشهای متعدد ارائه شده برای مسئله ی آشکارسازی چهره، این مسئله همچنان یک مسئله ی حل نشده تلقی می گردد و همچنین امکان بهبود کارایی روشهای ارائه شده برای آن وجود دارد. در این پژوهش، دو روش نوین برای مسئله ی آشکارسازی چهره برای تصاویر رنگی با استفاده از روشها و سیستمهای فازی ارائه می شود. در روش اول رویکرد نظری نوینی مبتنی بر مفهوم دانه دانه سازی فازی برای مسئله ی آشکارسازی چهره مطرح می شود. در این روش ابتدا قطعات همرنگ پوست انسان از پس زمینه جدا می شوند سپس هر یک از این قطعات توسط یک ابزار نوین طبقه بندی مبتنی بر دانه دانه سازی فازی به کلاسهای چهره و غیر چهره طبقه بندی می شوند. در روش دوم پس از استخراج قطعات همرنگ پوست انسان، منطقه ی لب درون آنها با استفاده از یک روش نوین قطعه بندی مبتنی بر رنگ لب تعیین می شود. سپس منطقه ی چشم و نوع وضعیت چهره براساس مکان منطقه ی لب با استفاده از یک سیستم استنتاج فازی تعیین می شود. در نهایت براساس میزان شباهت منطقه ی چشم بدست آمده با الگوهای چشم متناظر با وضعیت چهره، صحت کاندیدای چهره تعیین می شود. نتایج حاصل از شبیه سازی روشهای پیشنهادی و اعمال آنها برروی مجموعه تصاویر مختلف حاکی از کارامدی و دقت بالای آنها در آشکارسازی چهره در تصاویر رنگی می باشد.
شهروز نعمتی پور جمشید شنبه زاده
امروزه ما در جهان ترا بایت و میکروثانیه زندگی می کنیم، جایی که روزانه انبوهی از داده ها تولید میشود و در عین حال بازیابی سریع و بهینه اطلاعات مورد درخواست جوامع اطلاعاتی است. داده های چندرسانه ای شامل تصویر، صدا و ویدئو هستند. در نتیجه نیاز فوری برای ضبط، ذخیره و بازیابی چنین داده ای وجود دارد. تصویر ابتدائی ترین فرم داده چندرسانه ای است؛ به همین دلیل تحقیقات زیادی برای بازیابی چنین داده ای صورت گرفته است. سیستم های بازیابی معنایی تصاویر سیستم هایی هستند که برای پاسخگویی به این نیاز توسعه یافته اند. شکل اولیه این سیستم ها سیستم های بر پایه کلیدواژه بود که در نوع خود بی نظیر بود ولی معایب بسیاری داشت. برای همین سیستم هایی برپایه خصوصیات بصری تصویر مورد توجه قرار گرفت. یکی از مشکلاتی که بیشتر سیستم های بازیابی معنایی تصاویر با آن روبرو هستند مسئله شکاف معنایی است که عبارتست از اختلاف بین خصوصیات سطح پایین تصویر و درک انسان هوشمند از کل تصویر.یکی از بهترین روش هایی که برای کاهش شکاف معنایی در چند سال اخیر به آن توجه شده است بازخورد ارتباط است. در مدل پیشنهادی پایان نامه شکاف معنایی در دو مرحله کاهش می یابد. از شبکه های شعاع مدار برای بهبود بازخورد ارتباط استفاده می شود با این تفاوت که به جای بردارهای ویژگی سطح پایین، از بردارهای ویژگی سطح بالا استفاده می شود. این بردارهای ویژگی سطح بالا توسط یک شبکه عصبی چند لایه آموزش دیده تولید می شوند. در واقع در ابتدا بردار ویژگی سطح پایین توسط یک شبکه عصبی سه لایه به بردار ویژگی سطح بالا تبدیل می شود. سپس این بردار ویژگی سطح بالا به عنوان ورودی شبکه rbf برای بهبود بازخورد ارتباط استفاده می شود. شبیه سازی الگوریتم توسط پایگاه داده corel انجام شد. نتایج تحقیق بهبود حدود 10درصد در دقت بازیابی را نسبت به روش معمول و بدون پبش پردازش نشان می دهد.بهبود الگوریتم برای تصاویر عمومی چندان مطلوب نبود در حالیکه برای تصاویر حاوی اشیا این بهبود قابل ملاحظه بود.
عبدالرضا رشنو سید محمد احدی
سیستم تشخیص گوینده اتوماتیک یکی از سیستم های بیومتریک است که به دلایل امنیتی و کنترل تلفنی از راه دور در سالهای اخیر مورد توجه قرار گرفته است. روش های مختلفی برای بهبود کارایی این سیستم ها ارائه شده است. از آنجایی که این سیستم ها از ویژگی های با ابعاد بالا استفاده می کنند، بسیاری از این ویژگی ها اضافی و نامرتبطند و پیچیدگی این سیستم ها بالاست. یکی از روشهای بهبود کارایی این سیستم ها، حذف ویژگی های نامرتبط و اضافی مورد استفاده در آنهاست. تاکنون روشهای زیادی برای کاهش ویژگی در این سیستم ها مورد استفاده قرار گرفته است که همه این روشهای انتخاب ویژگی، رپر بوده اند و زمان انتخاب ویژگی برای آنها بالاست زیرا از کارایی سیستم به عنوان یک ارزیاب جهت انتخاب ویژگی استفاده می کنند و برای ارزیابی هر زیرمجموعه ویژگی باید سیستم را آموزش داده و پارامترهای آن را بدست آورند در اینجا یک روش انتخاب ویژگی بر مبنای relief برای سیستم های تصدیق هویت گوینده بر مبنای ماشین بردار پشتیبان ارائه شده است .این روش بر مبنای رپر بوده ولی از وزن های relief جهت استفاده کمتر از دقت سیستم، استفاده می کند. بنابراین پیچیدگی زمانی کمتری نسبت به دیگر روش های رپر دارند و می تواند فضای ویژگی را حداقل به 66% و eer را به 1.25% کاهش دهد. روش ارائه شده با روش های انتخاب ویژگی ژنتیک و الگوریتم بهینه سازی مورچگان مقایسه شده است و نتایج بدست آمده نشان می دهد که eer، تعداد ویژگی های کاهش یافته و پیچیدگی زمانی روش ارائه شده در مقایسه با این روش ها برای کرنل های مختلف ماشین بردار پشتیبان کمتر است.
فائزه مصری نژاد عاصفه عاصمی
با ورود کامپیوتر و اینترنت در جوامع تغییرات شگرفی به وجود آمد و بسیاری از سازمان ها به منظور ارائه خدمات خود، فناوری های مبتنی بر وب را جایگزین روش های سنتی نمودند. در سال های اخیر، وب 2.0 امکاناتی را فراهم آورده است که به موجب آن کاربران یک وب سایت خاص نیز می توانند در تولید محتوا شرکت داشته باشند. بکارگیری ابزارهای وب 2.0 در کتابخانه های دانشگاهی به کاربران کتابخانه اجازه می دهد که در یک محیط تعاملی با یکدیگر به تبادل اطلاعات بپردازند و از این طریق بر کیفیت برنامه های آموزشی و پژوهشی دانشگاه بیافزایند. پژوهش حاضر با هدف امکان سنجی مسائل انسانی در بکارگیری ابزارهای وب 2.0 در کتابخانه های دانشگاهی ایران وابسته به وزارت علوم، تحقیقات و فناوری و وزارت بهداشت، درمان و آموزش پزشکی، زمینه های لازم شامل میزان آشنایی و اطلاعات قبلی، میزان استفاده و نگرش کارکنان کتابخانه نسبت به بکارگیری ابزارهای وب 2.0 در کتابخانه های دانشگاهی را مورد مطالعه قرار داده است. روش پژوهش، توصیفی از نوع پیمایشی و جامعه آماری آن 60 کتابخانه مرکزی دانشگاهی بر اساس فهرست کتابخانه های مرکزی دانشگاهی موجود بر روی وب سایت کتابخانه ملی ایران می باشد. نمونه-گیری بر اساس جدول کرجسی و مورگان و با حجمی برابر با 52 کتابخانه بوده است. ابزار گردآوری اطلاعات، پرسشنامه مبتنی بر وب با ضریب پایائی برابر 89/0 و به منظور مطالعه میزان آمادگی و تخصص کارکنان کتابخانه به منظور بکارگیری ابزارهای تبادل اطلاعات، ابزارهای مدیریت و سازماندهی دانش، ابزارهای اشاعه و سازماندهی اطلاعات و ابزارهای مرجع مبتنی بر وب 2.0 در کتابخانه های دانشگاهی، تدوین گشته است. نتایج حاصل از پژوهش نشان داد که کارکنان کتابخانه های دانشگاهی با ابزارهای وب 2.0 آشنایی دارند، همچنین تمام فرض های مبتنی بر این که این افراد از ابزارهای وب 2.0 استفاده نمی کنند در سطح اطمینان 95% رد می-شود و به غیر از پادپخش ها، همه ابزارها در سطح قابل قبولی مورد استفاده قرار می گیرند. به علاوه، کارکنان به طور کلی موافق بکارگیری این ابزارها در وب سایت کتابخانه ها می باشند
حبیب الله اق اتابای جمشید شنبه زاده
بازیابی تصویر مبتنی بر محتوا یک زمینه تحقیقاتی است که هدف آن تسهیل فرایند جستجو و بازیابی تصاویر بر اساس ویژگیهای بصری تصاویر مانند رنگ، شکل و بافت، در پایگاه داده های بزرگ تصویری است. نیاز روزافزون به سیستمهای بازیابی تصویر در زمینه های چندرسانه ای مانند جلوگیری از جرم، تحصیل، اطلاعات جغرافیایی و ... باعث شده است که بازیابی تصویر یکی از موضوعات جذاب برای تحقیق باشد. با وجود ویژگیهای متنوعی که امروزه در سیستمهای بازیابی تصاویر، از آنها برای توصیف محتوای تصاویر استفاده می شود، انتخاب از میان این ویژگیها یکی از مراحل مهم برای طراحی یک سیستم بازیابی تصویر است. اما کدامیک از این ویژگیها برای توصیف تصاویر موجود در یک پایگاه داده خاص، به منظور کلاس بندی و بازیابی تصاویر، مناسب تر هستند؟ کاهش تعداد ویژگیها و انتخاب موثرترین آنها در کلاس بندی و بازیابی تصاویر هنوز فرایندی چالش برانگیز است. یکی از انواع روشها برای برآورده کردن این نیاز، روشهای انتخاب ویژگی نام دارد. گشتاورها یکی از انواع ویژگی های شکل تصاویر هستند، که کاربرد زیادی در کلاس بندی و تشخیص اشیا در تصاویر دارند. در این پایان نامه مسئله انتخاب ویژگی های مفید در کلاس بندی و بازیابی تصاویر، از میان ویژگیهای شکل مبتنی بر گشتاورها مورد بررسی قرار گرفته است. روشهای ارائه شده در این پایان نامه شامل روشی جدید برای وزن دهی ویژگیهای مبتنی بر گشتاور و روشهایی برای انتخاب زیرمجموعه ای از ویژگیها بر اساس وزنهای نسبت داده شده به آنهاست. در سیستم بازیابی تصویر پیاده سازی شده در این پایان نامه، از گشتاور legendre به عنوان ویژگی شکل و از پایگاه داده شکل coil-20 برای تحلیل روشها استفاده شده است. نتایج مقایسه روش وزن دهی ارائه شده و الگوریتم relieff نشان می دهد که روش ارائه شده تاثیر بهتری در کارایی فرایند انتخاب ویژگی و بازیابی تصاویر دارد، از این رو کیفیت کلی سیسـتم بازیابی تصویر را بهبود می بخشد.
سارا تورعی جمشید شنبه زاده
به منظور بررسی رابطه میان کارایی سیستم های مدیریت یادگیری و اثربخشی آن بر یادگیری دانشجویان دوره های الکترونیکی ، یک تحقیق به روش توصیفی- همبستگی انجام شد و داده های لازم از جامعه آماری دانشجویان دوره های الکترونیکی دانشگاه های الکترونیکی ، گردآوری شد. برای بررسی میزان اثربخشی سیستم مدیریت یادگیری بر یادگیری دانشجویان دوره های الکترونیکی ، متغیرهایی چون میزان یادگیری (بر اساس الگوی ارزیابی کرک پاتریک) ، میزان رضایت فراگیران ، کارایی سیستم مدیریت یادگیری(بر اساس خدمات پشتیبانی و خدمات تعاملی ارائه شده از سوی این سیستم ها) ، رضایت دانشجو ، عنوان دروس و رشته تحصیلی مشخص شد و برای ارزیابی میزان اثربخشی مورد بررسی قرار گرفت . در این تحقیق سه پرسش در راستای بررسی عوامل و شرایط افزایش کارایی سیستم مدیریت یادگیری و مشخصه های تأثیرگذار این سیستم ها بر یادگیری دانشجویان مطرح گردید که جهت پاسخگویی به آن ها شش فرضیه طراحی شده و با استفاده از آمار توصیفی و استنباطی مورد آزمون قرار گرفت . داده ها به وسیله پرسشنامه ای محقق ساخت ، گردآوری شدند . قبل از طراحی پرسشنامه ، جهت کشف معضلات و چالش های موضوع ، سوالاتی تشریحی و پاسخ آزاد در اختیار نمونه ای کوچک و خبره از جامعه آماری قرار گرفت . پرسشنامه بر اساس تحقیقات مشابه قبلی و پاسخ های سوالات تشریحی مرحله نخستین ، طراحی اولیه شد و روایی آن با تغییر و اصلاح مکرر پس از مشورت با اساتید راهنما و مشاور و آزمون کوچکی در جامعه آماری مورد تایید واقع شد . پایایی پرسشنامه پس از آزمودن آن در نمونه ای کوچک از جامعه آمار ی و محاسبه آلفای کرونباخ ، مورد تایید واقع شد . این مقدار برای پرسشنامه 84/. محاسبه شد که نشان دهنده پایایی قابل قبول آنست . با توجه به داده های گرد آوری شده در این پژوهش، به طور خلاصه می توان نتیجه گرفت که در مجموع سیستم ها ی مدیریت یادگیری توان بالایی در اثرگذاری بر یادگیری و رضایت دانشجویان دوره های الکترونیکی دارند . خدمات تعاملی ارائه شده در خلال سیستم مدیریت یادگیری با میزان کارایی سیستم رابطه ای مستقیم دارد . خدمات پشتیبانی سیستم های مدیریت یادگیری (شامل پشتیبانی فنی، پشتیبانی انواع محتوای یادگیری، آموزش و راهنمای به کارگیری نرم افزار) در میزان رضایت فراگیران تأثیر مستقیم دارد . میزان رضایت دانشجویان از سیستم مدیریت یادگیری در میزان کارایی این سیستم ها موثر است . و در نهایت افزایش کارایی سیستم مدیریت یادگیری ، موجب اثربخشی بیشتر یادگیری دانشجویان دوره های الکترونیکی می گردد. نتایج این پژوهش نشان دهنده اختلافی معنادار در رتبه اثربخشی یادگیری در هر رشته تحصیلی می باشد که می توان نتیجه گرفت رشته تحصیلی از عوامل تأثیرگذار بر میزان کارایی سیستم و اثربخشی آن بر یادگیری دانشجویان می باشد . همچنین عناوین درسی مختلف دارای تأثیر یکسان بر کارایی سیستم و یادگیری دانشجویان نمی باشند و می توان نتیجه گرفت یکی از فاکتورهای موثر در اثربخشی یادگیری دانشجویان، دروس ارائه شده در این سیستمها می باشد.
معصومه قدوسی جمشید شنبه زاده
با گسترش اینترنت، ابزارهای در دسترس برای برقراری ارتباط با مشتریان و مدیریت ارتباط با مشتری الکترونیکی در سازمان ها رایج شده است.ecrm در یک سازمان می تواند در سطوح گوناگون قرار داده شود. شرکت ایرانسل یکی از شرکت هایی است که به صورت اینترنتی با مشتریان خود ارتباط کسب و کاری دارد و در این خصوص خدماتی را در بستر وب توسط سایت خود به مشتریان ارائه می دهد لازم است تا تأثیر این سطح خدمات را بر وفاداری مشتریان خود بررسی نماید. هدف از این تحقیق این است که میزان اثر بخشی سطوح مدیریت ارتباط با مشتری الکترونیکی در وفاداری مشتریان شرکت ایرانسل را ارزیابی نماید. این تحقیق که در جامعه آماری کاربران ایرانسل در شهر تهران به تعداد نمونه 96 توزیع شده و 80 نمونه بدست آمده کامل با ابزار پرسشنامه اجرا گردید که روایی پرسشنامه توسط اساتید و پایایی آن با استفاده از آلفای کرونباخ که مقدار آن برابر 85/0 بدست آمد می باشد روش تحقیق در این بررسی توصیفی از نوع همبستگی بوده است. با عنایت به یافته های این تحقیق در یک نتیجه گیری کلی می توان گفت که بین سطوح ecrm و وفاداری مشتریان ارتباط معنا داری وجود دارد به طوری که : سطح اول مدیریت ارتباط با مشتریان الکترونیکی باعث وفاداری مشتریان نمی شود. سطح دوم مدیریت ارتباط با مشتریان الکترونیکی تا حدودی باعث وفاداری مشتریان می گردد. سطح سوم مدیریت ارتباط با مشتریان الکترونیکی بیشترین تأثیر را بر وفاداری مشتریان دارد
سیاوش علی پور جمشید شنبه زاده
ناحیه بندی یک گام ابتدایی و بسیار مهم در مباحث تحلیل تصویر است که نقش اساسی در تشخیص، طرح ریزی جراحی، و ارزیابی های مختلف پزشکی ایفا می کند. ناحیه بندی تصاویر پزشکی به دلیل ناهمگونی بافت، اثر حجم جزئی، نویز، آرتیفکت و تنوع ساختار بیماری های مختلف در بیماران گوناگون با مشکل مواجه است. برای حل مشکلات مذکور روش مدل های دگرشکل پذیر سطح پیشنهاد شده است. هدف از این رساله بررسی مدل های دگرشکل پذیر برای ناحیه بندی تصاویر پزشکی و ارائه الگوریتم مناسب به منظور رفع پاره ای از مسائل و مشکلات مذکور در این زمینه است. در میان مدل های دگرشکل پذیر در ناحیه بندی تصویر، مدل دو مرحله ای سریع ftc، یک مدل کارآمد و همچنین سریع می باشد. اما کارایی این مدل بسیار وابسته به منحنی اولیه می-باشد بطوریکه نیازمند مداخله کاربر برای انتخاب این منحنی است. یک متد جدید در این رساله برای تسهیل در ناحیه بندی تصاویر پزشکی پیشنهاد شده است که ترکیبی از الگوریتم ناحیه بندی فازی مبتنی بر کرنل با محدودیت مکانی skfcm و مدل ftc است. این رویکرد شامل دو مرحله پی در پی می باشد. ابتدا، از متد skfcm بمنظور انتخاب خودکار منحنی اولیه برای مرحله بعد استفاده می شود. سپس مدل ftc برای ناحیه بندی تصویر توسط تکامل منحنی مبتنی بر مجموعه سطح بکار گرفته می شود. درجه عضویت فازی علاوه بر انتخاب منحنی اولیه، در عبارت سرعت مبتنی بر داده مدل ftc برای بالا بردن قدرت و دقت الگوریتم پیشنهادی آمیخته گردید. ارزیابی عملکرد الگوریتم پیشنهادی در چندین نوع متفاوت از تصاویر پزشکی انجام شده است. نتایج تجربی مزایای الگوریتم پیشنهادی را در دقت، زمان محاسباتی و مقاومت در برابر نویز در مقایسه با پنج متد رایج دگرشکل پذیر برای ناحیه بندی تصاویر پزشکی نشان می دهد که عمل ناحیه بندی، با دقتی برابر با 95% در تصاویر نویزی با واریانس گاوسی 5% انجام می گیرد.
حسین شهسوارحقیقی منوچهر کلارستاقی
سیستم تشخیص گوینده یکی دیگر از سیستم های امنیتی و کنترل تلفنی از راه دور است ، که در سال های اخیر مورد توجه قرار گرفته است. در این پایان نامه به بررسی رویکردی برای افزایش کارایی سیستم های تشخیص گوینده می پردازیم. یک روش انتخاب ویژگی برای بهبود کارایی این سیستم ها ارائه شده است. این سیستم ها از ویژگی های با ابعاد بالا استفاده می کنند، که بسیاری از این ویژگی ها اضافی و نامرتبطند. حذف ویژگی های نامرتبط و افزونه ،) توسط ( fcbf موجب بهبود کارایی می شود. تاکنون روش های زیادی برای انتخاب ویژگی در این سیستم ها مورد استفاده قرار گرفته است که همه این روش های انتخاب ویژگی، رپر بوده اند و زمان انتخاب ویژگی برای آنها بالاست. در اینجا یک روش برمبنای fcbf +relieff برای کلاس بند ماشین بردار پشتیبان ارائه شده است .این روش از وزن های رلیف استفاده می کند . بنابراین پیچیدگی زمانی کمتری نسبت به دیگر روش های رپر دارد . نتایج بدست آمده نشان می دهد که ، پیچیدگی زمانی روش ارائه شده در مقایسه با روش های ژنتیک و کلونی مورچگان برای کرنل های مختلف ماشین بردار پشتیبان کمتر است. در فاز کلاس بندی پارامتر تعادل را معرفی می کنیم. . اکثر سیستم های تشخیص گوینده به یک پایگاه داده ی خاص با تعداد نفرات مشخص وابسته می باشند که در صورت تغییر در تعداد و کیفیت دیتاست، کارایی شان به شدت کاهش می یابد. بهره گیری از پارامترتعادل ما را به هدف اصلی پایان نامه ، که پیاده سازی یک سیستم تشخیص گوینده پویاست، نزدیکتر می نماید.
سید مصطفی افتخاری جمشید شنبه زاده
سیستم بینایی انسان قبل از بازشناسی رنگ یا شدت روشنایی، نوعی کشف لبه انجام می دهد بنابراین انجام کشف لبه قبل از تفسیر تصاویر در سیستمهای خودکار منطقی به نظر می رسد. انجام عملیات کشف لبه، پردازش مهمی در بسیاری از سیستمهای بینایی مصنوعی محسوب می شود. به تغییرات ناگهانی محلی در روشنایی تصویر لبه گفته می شود و لبه ها عموماً در مرز دو ناحیه اتفاق می افتند. حال به این مسائل می پردازیم که چگونه می توان لبه یابی انجام داد که تاثیر نویز و همچنین تغییر محیط تاثیری بر لبه یابی نداشته باشد.لبه یاب های معمول و مرسوم در تغییرات آهسته و پیوسته رنگ دچار مشکل هستند که باید این مشکل برطرف شود. در تمامی الگوریتم های لبه یابی نویز نمک و فلفل دارای تاثیر گذاری مخرب بسیار بالایی در تصاویر هستند که با روش پیشنهادی و استفاده از خاصیت گراف و استفاده از پنجره های پویا در هنگام عمل پیچش این مشکل برطرف می شود. در روش پیشنهادی روی نویز خاصی و سعی بر حذف آن کار نشده بلکه سعی بر این است که بحث استفاده از پنجره پویا در هنگام عمل پیچش و همسایگی هر پیکسل که در این روش تبدیل به یال می شوند را پایه قرار داده که با توجه به این خاصیت براحتی تاثیر نویز نمک و فلفل را از بین خواهد برد و همچنین در تصاویر که رنگ ها به آرامی تبدیل شده (دارای تغییرات آهسته شدت روشنایی هستند) و دارای لبه های ضعیفی هستند به خوبی عمل می کند.
محمدرضا صمدزاده مهابادی جمشید شنبه زاده
امروزه با رشد تکنولوژی و تبادل اطلاعات در جوامع بشری مساله امنیت اطلاعات دارای اهمیتی دو چندان می شود. امنیتی که بتواند اطلاعات مذکور را در مقابل انواع خرابیها، تغییرات و دستکاریها و همچنین کپی برداریهای غیر مجاز محفوظ دارد. مکانسیم واترمارکینگ علم جاسازی داده ها و یا الگوهای مشخصی در فایلهای صوتی، تصویری، فیلم یا متن به نحوی است که بتواند نیازهای امنیتی رسانه مورد نظر را به شکل آشکار یا پنهان برآورده کند. این عمل با کمترین تخریب در کیفیت رسانه مورد بحث اتفاق می افتد. الگوریتمهای واترمارکینگ زیادی در حوزه زمان و فرکانس وجود دارد. در الگوریتمهای حوزه مکان (پیکسل) محدودیتهایی در ظرفیت بیتهای جاسازی و مقاومت در برابر حملات وجود دارد، بطوریکه یک نویز کوچک می تواند واترمارک موجود در رسانه را از بین ببرد. در حالیکه در الگوریتمهای حوزه فرکانس تعداد بیتهای بیشتری را می توان در واترمارک دخیل کرد و یا به مقاومت بیشتر این الگوریتمها در برابر حملات اشاره کرد. بنابراین یک الگوریتم واترمارک باید با توجه به کاربرد آن مورد ارزیابی قرار گیرد. از جمله معیارهای ارزیابی یک سیستم واترمارک می توان به میزان مقاومت واترمارک در مقابل حملات، اعم از حملات مشترک در پردازش تصویر نظیر نویزی شدن تصویر، انواع فشرده سازیها و فیلترینگ تصویر و یا حملات هندسی اعم از انواع چرخش و برش تصویر اشاره نمود. اما با مطالعه روشهای مختلف مشخص گردید که هر یک از الگوریتمهای ارائه شده توسط محققین دارای مزایا و معایبی می باشند که استفاده از ترکیب روشهای ارائه شده می تواند در بهبود معیارهای ارزیابی واترمارک ما را یاری دهد. در این پایان نامه از ترکیب روشهای استخراج ویژگی و تبدیلات ویولت و فوریه به منظور بهبود کارایی الگوریتم واترمارکینگ بخصوص افزایش مقاومت واترمارک در برابر حملات هندسی استفاده می کنیم. بدین منظور ابتدا از تصویر نرمال شده تا سطح دوم تبدیل ویولت دو بعدی (ll2) گرفته و نقاط دارای اهمیت آن را توسط تشخیص گر هریس لاپلاسین استخراج کردیم، سپس برای به دست آوردن نواحی امن در اطراف هر نقطه، دایره ای با شعاع ثابت در اطراف هر نقطه رسم نمودیم. در این فرآیند پس از حذف نواحی موجود در حواشی تصویر و نواحی همپوشان، از دامنه تبدیل فوریه نواحی نرمال شده به منظور درج واترمارک استفاده نمودیم. نتایج حاصل از این تحقیق حاکی از کیفیت مطلوب تصویر واترمارک شده و افزایش میزان مقاومت واترمارک درج شده در تصویر، در برابر انواع حملات خصوصا حملات هندسی، در مقایسه با روشهای ارائه شده مشابه می باشد.
صادق پاسبان جمشید شنبه زاده
ناحیه بندی یک پردازش میانی در مباحث پردازش تصویر است که نقش اساسی در تحلیل تصاویر و بینایی ماشین دارد. معمولاً مرحله اول در تحلیل تصویر بخش بندی است. با عمل بخش بندی تصویر به قسمت های تشکیل دهنده اش تقسیم می شود. میزان بخش بندی، به موضوع مورد نظر بستگی دارد. یعنی وقتی اشیای مورد علاقه کاربرد مورد نظر از هم جدا شدند، باید بخش بندی متوقف شود. به طور کلی بخش بندی یکی از مشکل ترین کارها در پردازش تصویر است. این مرحله است که موفقیت یا شکست احتمالی تحلیل تصویر را تعیین می کند. در این بین عاملی به نام نویز مانعی برای رسیدن به ناحیه بندی مطلوب است. هدف این پایان نامه ارائه مدلیست که ناحیه بندی را در شرایط نویزی با درجه مطلوبیت خوبی به انجام برساند. برای این امر شبکه عصبی را به دلیل ویژگی های خوب آن از قبیل یادگیری و قابلیت تعمیم استفاده می کنیم. در این مدل از شبکه های عصبی بدون ناظر استفاده شده است. این شبکه ها برای یادگیری از رابطه بین الگو های ورودی استفاده می کنند. در این بین شبکه عصبی som از ویژگی های جالبی برای رسیدن به امر ناحیه بندی تصاویر نویزی برخوردار است.در این روش مشکل تعیین تعداد کلاس ها را می توان با تعیین یک سقف برای خروجی های آن برطرف کرد. ویژگی دیگر آن یادگیری بدون نیاز به الگوی ورودی می باشد. روال کار به این صورت می باشد که ابتدا بلاک های تصویر را به شبکه آموزش می دهیم، پس از پایان یادگیری دو سطح آستانه را بر روی خروجی ها اعمال می کنیم. این کار باعث می شود که ناحیه هایی که نماینده پیکسل های کمی هستند و همچنین ناحیه هایی که در شدت روشنایی بسیار نزدیک به هم هستند از بین بروند. خروجی روش پیشنهادی با الگوریتم های هم راستا از قبیل kmeans, fcm, som مورد مقایسه قرار داده ایم. این مقایسه با تصاویر پایه مختلف و با نویزهای مختلف صورت گرفته است و نتایج نشان داده است که روش پیشنهادی در شرایط نویزی بسیار مقاوم است و جواب خوبی را بر می گرداند.
لطف الله غلامی جمشید شنبه زاده
لبه یابی یکی از بخش های مهم ناحیه بندی تصاویر است که در پیداکردن اشیاء در تصاویر و پردازش تصویر نقش اساسی دارد. از آنجا که بیشتر لبه یابها، لبه ها را بصورت پیکسلهای جدا از هم استخراج می کند و لبه های اطراف اشیاء موجود در تصویر منفصل می باشند و بعضی از آنها که لبه ها را به صورت پیوسته استخراج می کنند، لبه های اضافی دیگری را نیز تولید می کند. تمام تلاش محققان بر این بوده است تا قدرت تشخیص تصاویر را به بینایی انسان نزدیک کنند. در این پژوهش سعی شده است تا اندکی در راستای نیل به این هدف گام برداشته شود. برای اینکه سیستم های کامپیوتری بتوانند لبه های اشیاء را در تصویر تشخیص دهند، ابتدا لازم است فضای رنگی تصویر را مشخص نمایند و در ادامه تصویر را تا حدودی هموار کنند و اثر نویزهای روی تصویر را از بین ببرند. برای هموار کردن تصویر به یک عمل پیش پردازش برای کاهش نویز احتیاج است که تا حدودی تصویر را هموارتر نماید و لبه ها را با استفاده از یک فیلتر آشکارساز لبه نمایان کند. در این رساله از تبدیل موجک گسسته haar بر روی تصویر استفاده شده است تا لبه ها را در سه زاویه 0° و 45° و 90° پیدا کند. سپس موجک dt_cwt بر روی تصویر اعمال شده است تا لبه ها را در شش جهت مختلف که شامل زوایای ±15° و ±45° و ±75° است، آشکار نماید؛ آنگاه با استفاده از تکنیک چند مقیاسی لبه ها متصل و بهبود داده می شوند؛ از یک لبه یاب canny برای حذف لبه های اضافی یافته شده استفاده شده است؛ در ادامه تصاویر به نواحی مختلفی توسط لبه ها تقسیم می شوند؛ سپس نقطه دانه هر ناحیه را مشخص کرده و با گسترش نقطه دانه ها، ناحیه ها را بسط داده تا زمانی که منجر به ترکیب دو ناحیه مجزا نگردد. نتایج ارزیابی الگوریتم پیشنهادی نشان می-دهد که این الگوریتم عملکرد بهتری نسبت به الگوریتم های لبه یابی ژنتیکی دارد.
سعید سرابی نوبخت جمشید شنبه زاده
این پایان نامه در خصوص بازشناسی متون چاپی فارسی و عربی به صورت مستقل از اندازه قلم است. بازشناسی آخرین مرحله در فرآیند ocr می باشد. در مراحل قبل انواع نویزها و چرخش موجود در تصویر برطرف شده، و ویژگی های مورد نظر از تصویر استخراج شده است. در روش پیشنهادی سیستم برای هر قلم فقط در یک اندازه مشخص آموزش داده می شود و پس از آن با دقت قابل قبولی در بازه ای از اندازه ها قادر به بازشناسی متون چاپی فارسی و عربی خواهد بود. همچنین در این سیستم فرآیند قطعه بندی و بازشناسی کاراکترها به صورت همزمان انجام می شود. اساس این روش بر استفاده از توصیفگرهای sift و مکانیزم پنجره لغزان استوار است. این توصیفگرها علاوه بر اینکه ساختار تصویر را به خوبی بیان می کنند، نسبت به برخی تغییرات مانند تغییر در مقیاس مقاوم هستند. علاوه بر توصیفگرهای sift، از تعدادی ویژگی های دیگر برای بالابردن میزان صحت بازشناسی استفاده شده است. به منظور افزایش کارایی، در روش پیشنهادی فضای حالت براساس موقعیت کاراکتر در کلمه به چهار حالت ابتدایی، میانی، پایانی و منفرد تقسیم، و برای هریک از این حالات یک کلاس بند در نظر گرفته شده است. همچنین در هریک از این چهار کلاس بند، با استفاده از مکانیزم وزن دهی به ویژگی ها، نرخ بازشناسی بهبود یافته است. فرآیند آموزش در این سیستم نسبت به سایر سیستم ها بسیار سریع تر است زیرا به ازای هر قلم، سیستم فقط در یک اندازه و روی تعداد اندکی سمبل آموزش می بیند. در پیاده سازی مرحله بازشناسی نیز، با استفاده از تکنیک هایی چون حافظه اشتراکی، مالتی ترد و توزیع پردازش روی هسته های پردازشی، سرعت اجرای الگوریتم بیش از 20 برابر نسبت به حالت عادی بهبود یافته است. الگوریتم پیشنهادی روی سه مجموعه داده pats ، apti و مجموعه داده حاصل از ocrdsg در حالت های مختلف تست شده است. نرخ بازشناسی در سطح کاراکتر برای مجموعه داده pats در بازه 98.13 تا 100 درصد و برای مجموعه داده apti در بازه 96.82 تا 100 درصد است. همچنین سیستم پیشنهادی روی مجموعه داده بدست آمده از ocrdsg به ازای هفت قلم فارسی متداول و در 13 اندازه مختلف، بر موتور بازشناسی tesseract پشتیبانی شده توسط گوگل غلبه دارد. در این حالت نرخ بازشناسی سیستم در سطح کاراکتر در بازه 97 تا 100 درصد است. نتایج این تست ها از عملکرد بسیار خوب این الگوریتم خصوصاً در اندازه های نزدیک به اندازه آموزش سیستم حکایت دارد. سیستم پیشنهادی تقریباً بر همه سیستم های شرکت کننده در مسابقه ذکر شده در متن پایان نامه غلبه می کند. توجه شود که این سیستم فقط برای یک اندازه آموزش داده شده و فاقد هرگونه لغتنامه و یا مرحله پس پردازش است. با آموزش سیستم برای اندازه های مختلف، نرخ بازشناسی در تمامی حالت ها به بیش از 99% می رسد.
فاطمه عسگری جمشید شنبه زاده
دستهبندی تصاویر در منابع گوناگون از مسایل مهم بینایی ماشین است. یکی از قسمتهای این دستهبندی، دستهبندی صحنهها است. دستهبندی صحنه عبارت است از مدل کردن سیستمی که ابتدا تعدادی تصویر صحنه را دریافت کرده و با استفاده از روشهای استخراج ویژگی، از هر تصویر ویژگی کد شدهای را بدست میآورد و سپس با استفاده از این ویژگیهای جدید تصاویر اولیه را نمایش داده و به دستهبندی تصاویر میپردازد. برای انجام خودکار این دستهبندی از روشهای گوناگونی استفاده میشود. اکثر این روشها از ویژگیهای کلی که به طور مستقیم از تمام تصویر استخراج میشود استفاده میکنند مانند: رنگ و بافت و ویژگیهای استخراج شده توسط الگوریتم سیفت و سایر روشهای کاربردی که در فصلهای آتی به طور مفصل مورد بحث قرار خواهند گرفت. یکی از روشهای متمایز شناسایی یا دستهبندی صحنه با استفاده از تشخیص اشیا موجود در تصویر )مخصوصا تصویر صحنههای داخلی( است. که مبتنی بر یافتن تعداد محدودی از اشیا از قبل مشخص شده میباشد. در روش ارائه شده ابتدا پنجره احاطه کننده هر شی، بدون در نظر گرفتن نوع شی، یافت میشود. سپس از محدوده شی یافت شده ویژگی سیفت استخراج میشود. از روی تمام ویژگیهای استخراج شدهی مربوط به اشیا با استفاده از خوشه بندی کا-میانگین 1 ، واژهنامه ساخته میشود. سپس با کد کردن ویژگیها برای هر تصویر به صورت محلی و خطی به یک بردار ویژگی میرسیم. در این پژوهش نشان داده میشود که این ویژگی جدید در دستهبندی صحنههای داخلی که معمولا با اشیا مختلف شناخته میشوند، مفید خواهد بود. ارزیابی الگوریتم پیشنهادی در دو مرحله انجام گرفته است. مرحله اول ارزیابی دستهبندی صحنههای داخلی میباشد، و مرحله دوم بررسی پیچیدگی اجرایی الگوریتم پیشنهادی میباشد. براساس نتایج بدست آمده، پاسخ الگوریتم پیشنهادی به علت استخراج ویژگیهای مناسب و استفاده همزمان از خصوصیات سطح بالا و محلی تصویر، در شرایط مختلف همچون پیچیدگی تصاویر و تداخل اشیا مطلوب میباشد.
مصطفی مهدی جو جمشید شنبه زاده
یکی از مهمترین مراحل در فرآیند کلی ocr، مرحله ی شناسایی کاراکترهای قطعه بندی شده می باشد که تاکنون روشهای متعددی برای انجام این کار مورد آزمایش قرار گرفته است. اما نقاط ضعف هر کدام از این روشها و این واقعیت که برخی از آنها بر اساس ویژگیهای یک زبان خاص طرح ریزی شده اند، مانع از دستیابی به یک روش جامع و کلی برای امر شناسایی کاراکتر گردیده است. در سال 2005، شیوه ی مدلسازی و محاسباتی نوینی تحت عنوان حافظه ی سلسله مراتبی موقتی توسط آقای جف هاوکینز ارائه گردید که حاصل تحقیقات وی بر روی نحوه ی عملکرد مغز انسان می-باشد. از آنجا که این روش در صدد شبیه سازی عملکرد مغز انسان تا حد امکان بوده و با در نظر گرفتن این واقعیت که فرآیند دسته بندی (شناسایی) کاراکترها با اشکال و صور مختلف برای انسان امری ابتدایی و راحت می باشد، لذا از نقطه نظر شهودی و همچنین بر اساس مبانی نظری این روش، انتظار آن می رود که بتوان از این روش در امر شناسایی کاراکتر حداکثر استفاده را به عمل آورد. در سند حاضر، ضمن معرفی برخی از مهمترین روشهای متداول برای شناسایی کاراکتر و بررسی نقاط قوت و ضعف آنها، سعی بر آن است، شیوه ی جدید یاد شده مورد بررسی قرار گرفته و از آن در امر شناسایی کاراکتر پارسی استفاده به عمل آید.
عبدالحسین صراف زاده رضا حسینی نژاد
این پایان نامه روشی برای بازشناسی متون چاپی فارسی و زبان های دارای الفبای مشابه آن مانند عربی ارائه می دهد. بازشناسی آخرین مرحله در فرآیند ocr است که در آن به وسیله ویژگی های به دست آمده از تصویر، متن موجود در آن تشخیص داده می شود. تصویر مورد استفاده، در مراحل قبل پیش پردازش شده، انواع نویزها و چرخش آن برطرف گشته، و در نهایت دودویی شده است. در این روش، نوع و اندازه قلم یا قلم های استفاده شده در متن نیز باید مشخص باشند. الگوریتم پیشنهادی از مدل پنهان مارکوف استفاده می کند. این مدل یکی از موفق ترین روش های بازشناسی گفتار می باشد که به دلیل وجود شباهت های بسیار، در سال های اخیر در بازشناسی متون نیز مورد توجه زیادی قرار گرفته است. مدل پنهان مارکوف شامل حالات به همراه احتمال گذر بین آن هاست و در هر حالت می توان مشاهدات احتمالی مختلفی نیز داشت. برای بازشناسی متن، مشاهدات می توانند مجموعه ای از مقادیر پیکسل ها و حالات بیانگر بخش های حروف باشند. برای کوچک کردن فضای حالت ویژگی ها و در نتیجه ساده تر کردن محاسبات، در این روش از کوانتیزاسیون برداری نیز استفاده شده است که این کار با کمک خوشه بندی انجام می شود. در این پایان نامه روش های مختلف خوشه بندی نیز ارائه شده و کارایی آن ها در مسئله بازشناسی بررسی گشته و در نهایت الگوریتم خوشه بندی agglomerative مورد استفاده قرار گرفته است. در فرآیند آموزش روش ارائه شده، سیستم تعداد زیادی تصاویر متنی به همراه اطلاعات قطعه بندی آن ها در سطح کاراکتر دریافت می کند. سپس یک پنجره در راستای خط زمینه حرکت کرده و ابتدا برای حالات مختلف هریک از کاراکترها یک مدل پنهان مارکوف ایجاد می شود. در نهایت با بررسی احتمال قرارگیری حروف در کنار یکدیگر، تمامی این مدل ها به یکدیگر متصل شده و یک مدل پنهان مارکوف کلی نیز تشکیل می گردد. آموزش مدل ها در این فرآیند توسط الگوریتم baum-welch می باشد. در بخش تست، سیستم تصویر متن را دریافت کرده و با استفاده از مکانیزم پنجره ذکر شده، دنباله ای از ویژگی ها را نتیجه می دهد. در این جا نیازی به قطعه بندی نیست و تنها تشخیص محل قرارگیری خط کافی می باشد. با وارد کردن این دنباله مشاهدات به مدلی که در مرحله قبل آموزش داده شده، مدل پنهان مارکوف بهینه ترین زنجیره از حالات که بیانگر متن موجود در تصویر است، را با استفاده از الگوریتم viterbi به ما بر می گرداند. برای بررسی عملکرد این سیستم در زبان فارسی، با استفاده از چندین واژه نامه معتبر، مجموعه وسیعی از کلمات ایجاد کرده و با کنار هم قرار دادن تصادفی آن ها متون زیادی را تشکیل داده ایم. سپس تصاویر این متون را با قلم های مورد نظر تولید و ساختار مناسبی برای توصیف آن ها ایجاد نموده ایم. به منظور مقایسه نیز از مجموعه داده عربی pats استفاده شده است. برای مجموعه تصاویر توسعه داده شده نرخ بازشناسی بین 98.32 تا 100 و برای مجموعه داده pats بین 95.37 تا 100 قرار دارد.
آتنا فرهمند جمشید شنبه زاده
در این پایان نامه، یک روش جدید جهت رفع نویز و دودویی سازی تصویر اسکن شده اسناد با جامعیتی بالاتر از روش های موجود ارائه شده است. رفع نویز یکی از بخش های مهم در مرحله پیش پردازش سیستم های بازشناسی حروف با کمک ابزار نوری ( ocr) است. تصاویر اسناد، ممکن است در مرحله تولید (چاپ یا نوشتن)، اسکن شدن یا آرشیو شدن پیش از اینکه هرنوع پردازش هوشمندی روی آن ها انجام گیرد، دچار نویز شوند. از آنجایی که وجود نویز در تصویر، روی عملکرد سیستم ocr تاثیر نامطلوبی می گذارد، رفع این نویزها، پیش از مراحل قطعه بندی و بازشناسی، یکی از بخش های مهم و ضروری در مرحله پیش پردازش سیستم ocr است. دقت رفع نویزهای موجود به صورت مستقیم بر دقت و سرعت سیستم ocr تأثیر می گذارد و به دلیل تنوع انواع آ ن ها در تصاویر اسناد و محدودیت روش های مطرح شده در مواجهه با انواع مختلفی از نویزها در کنار هم، تلاش برای ارائه روش های جامع تر با دقتی بالاتر همچنان ادامه دارد. روش های بسیاری برای رفع نویز و دودویی سازی تصاویر اسناد در طی سالیان ارائه شده است. اغلب این روش ها محدود به رفع یک نویز خاص در تصویر هستند و جز روش هایی که روی رفع نویزهای زمینه کار می کنند، اکثر روش ها تنها روی تصویر دودویی اعمال می شوند. این بدان معناست که باید یک مرحله دودویی سازی پیش از رفع نویز انجام گیرد که علاوه بر دشواری تعیین حد آستانه مناسب با وجود نویز در تصویر، خود دودویی سازی می تواند باعث به وجود آمدن نویز در تصویر شود. همچنین در بسیاری از روش ها، با رفع نوعی از نویز، نوع دیگری به وجود می آید که مطلوب نیست لذا در این پایان نامه به از بین بردن مجموعه ای از نویزها در کنار هم توجه شده و همزمان با این عمل دودویی سازی هم انجام می شود. برای این منظور از خوشه بند kfcm جهت خوشه بندی پیکسل های تصویر، با توجه به ویژگی های مناسب، به متن، نویز و زمینه استفاده می شود. به این ترتیب تشخیص پیکسل های ناخواسته در تصویر و دودویی سازی تواماً انجام می شود. همچنین به دلیل انتخاب ویژگی های مناسب جهت انجام خوشه بندی ، سیستم دقت مناسبی نیز دارد.
مرتضی محمدی جمشید شنبه زاده
در دهه گذشته شاهد گسترش سریع استفاده از دوربین های ویدئویی در شئون مختلف زندگی انسان بوده ایم. این گسترش باعث توجه بسیار زیاد به علم پردازش ویدئو و انجام پژوهش های گسترده در استخراج محتوای معنایی ویدئو شده است. شناسایی رفتار انسان یکی از موضوعات مهم و پرکاربرددر این حوزه می باشد که دارای کاربردهای بسیاری مانند کد کردن ویدئو، آنالیز حرکات بیماران و ورزشکاران ، سیستم های نظارتی هوشمندو واسط های کاربری پیشرفته و واقعیت مجازی می باشد. تفکیک اعمال مشابه و شناسایی آن ها در بسیاری از کاربردها، دارای اهمیت می-باشد. زمان پردازشی نیز ویژگی مهم دیگری است که با توجه به کاربردهای مختلف، از اهمیت ویژه-ای برخوردار می باشد. هدف این پایان نامه ارائه ی رویکردی برای شناسایی رفتارانسان بر اساس تشخیص حالت و استخراج ویژگیهای زمانی مکانی محلی است که علاوه بر بهبود در نرخ شناسایی رفتار در زمان پردازشی کوتاهی نیز انجام شود. روش پیشنهادی ، تشخیص حالت انسان برای استخراج ویژگیهای زمانی مکانی محلی و بازنمایی و شناسایی رفتار می باشد. شناسایی رفتار در سه فاز مشاهده، تشخیص حالت و استخراج ویژگی وبازنمایی و دسته بندی رفتارها انجام می شود. مشاهده رفتار در دو بخش استخراج شبح و انتخاب فریم های کلیدی انجام می شود. در بازنمایی رفتاریا استخراج ویژگی، از تشخیص حالت و استخراج ویژگیهای زمانی مکانی محلی استفاده شده است. در این فاز ، براساس ویژگی های شکلی و هندسی طبیعی بدن انسان، اعضای بدن شناسایی شده و از نسبت قرار گرفتنشان حالت فرد شناسایی می شود. با توجه به موقعیت های پیدا شده از اعضای بدن انسان، ویژگی های مورد نیاز برای بازنمایی رفتارها، استخراج می شود. بیشترین تکرار اعضای بدن وتعداد تغییراتشان و میانگین زاویه های اعضای بدن از جمله ویژگیهای به دست آمده می باشندکه استخراج شده ومحلی می شوند. در نهایت ویژگی های استخراج شده از مرحله ی بازنمایی رفتار، دسته بندی می شوند. در ادامه ی پژوهش روش اختلاط خبره هاارائه شده که از ترکیب و ادغام چند دسته بند استفاده میکند که به بهبود کار می انجامد. نتایج به دست آمده کارامد بودن این الگوریتم در شناسایی رفتارهای مشابه وهمچنین افزایش نرخ تشخیص را نشان می دهد. زمان پردازشی بدون در نظر گرفتن استخراج شبح انسان اندازه گیری شده و دسته بندی رفتارها نیز به صورت برخط انجام شده است. نرخ تشخیص به دست آمده در مقایسه با کارهای مشابه انجام شده بسیار مناسب بوده که کارآمد بودن روش پیشنهادی را نشان می دهد.
فاطمه فاضلی جمشید شنبه زاده
هدف از این پایان نامه معرفی روشی برای دودویی سازی مستندات چاپی و اسکن شده به زبان فارسی بر اساس ویژگی های آن ها می باشد. این فرآیند باعث کاهش چشمگیر حجم اسناد می شود و یکی از مهمترین مراحل فرآیند پیش پردازش و بهبود کیفیت تصاویر است. فرآیند دودویی سازی بطور کلی نوعی کلاس بندی پیکسل های تصویر بر اساس ویژگی های آن ها می باشد. ورودی این فرآیند برداری از ویژگی های تصویر می باشد که با استخراج مهمترین ویژگی ها و ایجاد تابع ارزیابی بر اساس آن ها، مقدار حد آستانه مناسب جهت کلاس بندی پیکسل ها محاسبه می شود. ویژگی های استخراجی می توانند ویژگی های کلیِ تصویر و یا ویژگی های محلی و یا ترکیبی از هر دو نوع باشند. این پایان نامه سعی دارد تا با استخراج ویژگی های مناسب به دودویی سازی اسناد بپردازد. الگوریتم پیشنهادی ابتدا بر اساس ویژگی های کلی تصویر، آن را بلاک بندی می کند و سپس با استخراج ویژگی های مناسب از هر بلاک به جداسازی بلاک های متنی از بلاک های غیر متنی می پردازد و در پایان بلاک های متنی را بطور جداگانه دودویی می کند. ارزیابی الگوریتم پیشنهادی در سه مرحله انجام گرفته است. مرحله اول ارزیابی عملیات جداسازی بلاک های متنی و غیر متنی می باشد، مرحله دوم ارزیابی شهودی و محاسباتی فرآیند دودویی سازی است و مرحله سوم بررسی پیچیدگی اجرایی الگوریتم پیشنهادی می باشد. براساس نتایج بدست آمده، پاسخِ الگوریتم پیشنهادی به علت استخراج ویژگی های مناسب و استفاده همزمان از خصوصیات کلی و محلی تصویر، در شرایط مختلف همچون نویز و توازن نورِ متغیر، مطلوب می باشد.
فرشته متاعی مقدم جمشید شنبه زاده
دسته بندی تصاویر از مباحث پرکاربرد در زمینه ی بینایی ماشین است که در مواردی از قبیل رباتیک، جستجوی تصاویر، تشخیص چهره و ... مورد استفاده قرار می گیرد. در بین روش های مطرح در این زمینه؛ دسته بندی با استفاده از کیسه ی کلمات کلیدی، از رایج ترین و کاراترین روش ها می باشد که در روش پیشنهادی در این پایان نامه هم استفاده شده است. در روش پیشنهادی برای ساخت واژگان یا کیسه ی کلمات کلیدی، ابتدا نقاط کلیدی تصاویر را توسط توصیفگر brisk تفسیر کرده و در نهایت با استفاده از روش خوشه بندی k میانگین و روش فازی c میانگین، خوشه بندی کرده و مراکز هر خوشه را به عنوان اعضای واژگان استخراج می کنیم. البته ساخت واژگان به صورت غیر فازی دارای معایبی از قبیل عدم قطعیت، عدم مقبولیت و از دست رفتن اطلاعات است اما در عین حال دارای مزایایی از قبیل سرعت بالاتر و حجم محاسبات کمتر می باشد. پس از تست و مقایسه نتایج آزمایش روی اندازه های مختلف واژگان مشخص شد روش های پیشنهادی کاراتر از روش های ارائه شده ی پیشین هستند و علاوه بر این به دلیل استفاده از توصیفگر brisk حجم محاسبات نیز کاهش یافته است.
مهدی فرجی جمشید شنبه زاده
a problem of computer vision applications is to detect regions of interest under dif- ferent imaging conditions. the state-of-the-art maximally stable extremal regions (mser) detects affine covariant regions by applying all possible thresholds on the input image, and through three main steps including: 1) making a component tree of extremal regions’ evolution (enumeration), 2) obtaining region stability criterion, and 3) cleaning up. mser performs very well, but, it does not consider any information about the boundaries of the regions which are important for detecting repeatable extremal regions. we have shown in this paper that employing prior information about boundaries of regions results in a novel region detector algorithm that not only outperforms mser, but avoids the mser’s rather complicated step of enumeration and the cleaning up. to employ the information about the region boundaries we introduce maxima of gradient magnitudes (mgms) which are shown to be points that are mostly around the boundaries of the regions. having found the mgms, the method obtains a global criterion (gc) for each level of the input image which is used to find extremum levels (els). the found els are then used to detect extremal regions. the proposed algorithm which is called extremal regions of extremum lev- els (erel) has been tested on the public benchmark dataset of mikolajczyk [111]. the obtained experimental results show that the proposed erel method is robust against gaussian noise and outperforms the state-of-the-art methods in terms of the accuracy of the repeatable detected regions.
سهیلا شیخ بهائی جمشید شنبه زاده
در دنیای واقعی رابطه ای قوی بین محیط و اشیاء وجود دارد که استفاده از اطلاعات مربوط به روابط اشیاء و صحنه نقش مهمی در فرآیند بازیابی شئ ایفا می کنند. یعنی زمانی که در یک صحنه شئ خاصی جستجو می شود، یک بیننده در موقعیت هایی از تصویر تمرکز می کند که بیشترین احتمال پیشین را برای وجود شئ مورد نظر دارا هستند. بنابراین متن صحنه برای تصمیم گیری درمورد حرکات بعدی چشم بسیار تعیین کننده است و زمانیکه اطلاعات ظاهری شئ به دلیل کوچک بودن شئ، شلوغی صحنه، وجود مانع و یا هر نوع ابهام دیگری برای بازشناسی آن کافی نباشد، می توان از اطلاعات متن تصویر مانند نوع صحنه و اشیاء دیگر صحنه برای بازشناسی شئ کمک گرفت. به منظور توسعه روشی دقیق برای بازشناسی شئ در تصاویر واقعی و با وجود اشیاء مختلف در این پایان نامه راه حل هایی ارائه شده است که بازیابی شئ را با استفاده از اطلاعات متنی یعنی اشیاء دیگر تصویر و تعداد آنها انجام می دهد و هدف بهبود دقت بازیابی شئ است.
فاطمه قنبری عدیوی جمشید شنبه زاده
بازشناسی صحنه یکی از مسائل چالش برانگیز در بینایی ماشین است که شامل استخراج ویژگی و انتخاب کلاسبند می باشد. استخراج ویژگی نقش کلیدی در آن دارد. روش های پیشنهادی را می توان از دو دیدگاه سطح (سطح پایین و سطح مفهومی) و مقیاس (محلی و سراسری) استخراج ویژگی تقسیم بندی کرد. به دلیل وجود شکاف معنایی میان ویژگی های سطح پایین و مفاهیم معنایی و عدم توجه به رابطه مکانی بین اجزای تصویر در روش های مبتنی بر ویژگی های سراسری، استفاده از ویژگی های محلی همراه با آن ها ضرورت می یابد. در این پایان نامه رویکرد جدیدی روی دسته صحنه های خارجی ارائه شده است که پس از به دست آوردن دو بردار ویژگی سراسری جیست و ویژگی محلی سیفت برای هر تصویر، دو کلاسبند را به صورت جداگانه آموزش دادیم و نتایج خروجی را با استفاده از قانون ترکیبی ضرب ترکیب کردیم. نتایج عملی نشان می دهند که روش پیشنهادی کارایی قابل قبولی در مقایسه با روش های قبلی به دست آورده است.
مریم یکه زارع جمشید شنبه زاده
تصاویر رادیولوژی و ام آر آی (تشدید مغناطیسی) از پرکاربرد ترین تصاویر پزشکی جهت تشخیص بیماری هستند. تصویربرداری ام آر آی به عنوان یکی از قوی ترین روش های تصویربرداری تشخیصی شناخته شده است. تصویر برداری رادیولوژی سریع تر از تصویربرداری ام آر آی است و در تشخیص بیماران تروما اهمیّت ویژه ای دارد. تروما به معنی آسیبی است که بر اثر وارد شدن ضربه به بدن به وجود می آید. عدم تفکیک بافت های سخت و نرم در تصاویر پزشکی، به خصوص تصاویر رادیولوژی، چالشی بزرگ پیش روی تشخیص صحیح می باشد. این پایان نامه با هدف بهبود تصاویر پزشکی پرکاربرد (رادیولوژی و ام آر آی) انجام و از پیش پردازش به عنوان یک راهبرد اساسی برای قطعه بندی به منظور بهبود تصاویر استفاده شده است. جهت بررسی و مقایسه بهتر نتایج، از سه نوع تصویر بافت سخت استخوان (دست)، بافت نرم (مغز) و نوعی مخمر استفاده می شود. برای مرحله پیش پردازش چهار فیلتر (بالاگذر باترورث، بالاگذر گوسین، باترورث با تاکید بر فرکانس بالا و گوسین با تاکید بر فرکانس بالا) مورد استفاده قرار می گیرد. سپس الگوریتم های برنارد، شی، چان و وز و لی برای قطعه بندی تصاویر به کار گرفته می شود. در انتها، تصاویر از نظر معیار های کیفی (بصری) و کمّی (تعداد تکرار الگوریتم، زمان محاسباتی cpu و معیار شباهت تاس) مورد مقایسه و تحلیل قرار می گیرند. در روش پیشنهادی، سعی شده است تا با دور ریختن اطلاعات اضافی در مرحله پیش پردازش، تصاویر مناسب تری را برای مرحله قطعه بندی فراهم کنیم. به طور کلی، نتایج معیارهای ارزیابی نشان داد که پیش پردازش تصاویر با فیلترهای گوسین و تاکید بر فرکانس بالا باترورث بهترین عملکرد را داشت و همچنین بهترین نتیجه قطعه بندی بر روی تصاویر پیش پردازش شده با استفاده از الگوریتم برنارد حاصل شد.