نام پژوهشگر: حمیدرضا پوررضا
جواد سیاح زاده حمیدرضا پوررضا
استفاده از صفحات وب به منظور تجارت، سرگرمی، کسب علم و ... در سال های اخیر رشد چشم گیری داشته است. با وجود مزایای فراوان، استفاده از اینترنت معایبی نیز دارد. یکی از این معایب بروز مشکلات سلامتی در کاربران می باشد که اغلب این مشکلات به خاطر استفاده مداوم و نادرست از کامپیوتر بوجود می آید. مشکلات بصری نیز جزء همین دسته از مشکلات می باشند که در صورت استفاده نادرست از نمایش گر (تنظیم نبودن ارتفاع، عدم کیفیت صفحه نمایش، عدم خوانایی متن و ...) و همچنین عوامل محیطی (تنظیم نبودن نورپردازی محیط) به وجود می آید. ما در این پایان نامه به بررسی عدم رضایت کاربر در مواجهه با اندازه متن ریز صفحات وب پرداخته ایم. در ابتدا یک بانک داده ویدیویی تهیه شده است. این بانک حاوی 76 ویدیو از 76 نفر می باشد. از این افراد در حال کار با صفحات وب شبیه سازی شده فیلم برداری شده است. نام این بانک به اختصار wesd انتخاب شده است. پس از تهیه بانک wesd، عکس العمل هایی که فرد در مواجهه با متن ریز از خود بروز می دهد بایستی شناسایی شوند که برای این منظور عکس العمل های احتمالی شامل پلک زدن، جلوآمدن به سمت نمایش گر، گشاد شدن چشم و تنگ شدن چشم به صورت دستی از این ویدیوها استخراج شده است. با آمارگیری از این عکس العمل ها، به این نتیجه می رسیم که دو عکس العملی که بیش تر از بقیه، در برابر متن ریز رخ می دهد "تغییر نرخ پلک زدن" و "جلوآمدن فرد به سمت نمایش گر" می باشد. با ارائه یک روش ارزیابی، دقت کلی تشخیص ریزی متن از روی این دو عکس العمل 5/81% به دست می آید. برای خودکارسازی تشخیص ریزی متن، دو عکس العمل پلک زدن و جلوآمدن بایستی به صورت خودکار تشخیص داده شوند و بنابراین در ادامه، دو روش برای آشکارسازی پلک زدن و آشکارسازی جلوآمدن ارائه شده است. آشکارساز پلک زنی پیشنهادی بر اساس انطباق الگوی آنلاین با کمک معیار ssd عمل تشخیص را انجام می دهد. از خصوصیات این آشکارساز پلک زنی، مقاومت در برابر حرکات فرد می باشد که به خاطر آستانه های وفقی چشم باز و چشم بسته می باشد. از دیگر نقاط قوت این آشکارساز، بالارفتن دقت آن با ارائه ویژگی جدید "نسبت ارتفاع قله اوج منحنی عدم شباهت به همسایه ها" می باشد. دقت تشخیص این آشکارساز پس از تست بر روی بانک wesd 89/97% و با تست بر روی بانک zju برابر 03/96% بدست آمده است. تشخیص خودکار جلوآمدن فرد، با استفاده از آشکارساز جلوآمدن پیشنهادی انجام می شود. در آشکارساز جلوآمدن، با توجه به مساحت ناحیه سر پیدا شده توسط آشکارساز صورت viola-jones، منحنی مساحت با دقت یک ثانیه تشکیل شده و پس از رفع خطاهای آشکارساز صورت در این منحنی، یک منحنی تفاضل از روی منحنی مساحت ساخته می شود که حاصل تفریق ثانیه های پشت سر هم منحنی تفاضل می باشد. پیک های منحنی تفاضل به معنای جلوآمدن فرد در آن لحظه تشخیص داده می شود. آشکارساز جلوآمدن پشنهادی، با دقت کلی 6/99% عمل تشخیص را انجام می دهد. در انتها، پس از قرار دادن آشکارساز پلک زنی پیشنهادی و آشکارساز جلوآمدن پیشنهادی، عمل تشخیص ریزی خودکار متن با دقت 24/73% انجام می شود که با توجه به دقت تشخیص ریزی متن از روی ground truth، به 83% از آنچه هدف بوده است رسیده ایم.
الهه سلیمانپور حمیدرضا پوررضا
هدف این پایان نامه، ارائه روشی خودکار برای تشخیص ندول درعکس های پرتوایکس ریه می باشد. چنین نرم افزاری می تواند در فرآیند تشخیص سرطان ریه، نقش بسزایی در تصمیم گیری پزشک داشته باشد. ورودی این نرم افزار، عکس های خام پرتوایکس قفسه سینه می باشند. سپس طی چهار مرحله، عملیات پردازش تصویر، تصمیم گیری به صورت کاملاً خودکار انجام می گردد. این مراحل شامل قسمت های زیر می باشند: درابتداهمه تصاویر پایگاه داده،پالایش شده تاکیفیت آن هاازنظرسطح روشنایی وکنتراست بهبودیابد.سپس جهت قطعه بندی نواحی ریه از زمینه، الگوریتمی پیشنهاد شده است. این الگوریتم به کمک روش های هوشمند رشد ناحیه مبتنی بر عملیات مورفولوژی و آستانه گذاری وفقی، می تواند با سرعت و دقت مطلوبی نواحی قابل مشاهده و نیز پنهان ریه را، از زمینه تصویر جدا نماید. از دیگر روش های پیشنهادی به منظور بهبود کنتراست ندول، اعمال الگوریتمی جهت تضعیف ساختارهای نرمال ریه می باشد. به کمک این الگوریتم تاثیر همپوشانی دنده ها بر روی ندول ، تا حد کارایی بهبود یافته است. درمرحله دوم،مناطقی که احتمال بیشتری برای سرطانی بودندارندبااستفاده ازروش های هوشمندپردازش تصویروبااطلاع ازشکل عمومی ندول هااستخراج می گردند.درسومین مرحله،برخی ازویژگی های مبتنی بر تحلیل بافت این نواحی،محاسبه شده وسرانجام درمرحله آخر به یک طبقه بندباطراحی مناسب که قبلاًتوسط ورودی های مشابه زیادی آموزش دیده است،داده می شوند.این روش بسیار سریع بوده ونسبت به روش های مشابه،بهبودیافته است.درفازاستخراج ویژگی، علاوه بر استفاده از ویژگی های آماری رایج در حوزه پردازش تصویر، از فیلترهای گابور دایروی، گابورلگاریتمی و فیلترlogاستفاده شده است.همچنین، اثر همپوشانی ندول ها توسط ساختارهای استخوانی، با استفاده از الگوریتمی که مبتنی بر فیلتر گابور مکانی جهتدار می باشد، تا حد مطلوبی بهبود یافته است. در فاز طبقه بندی، از ترکیب چند طبقه بنداستفاده شده و نتایج پیاده سازی، با چند نمونه از سامانه های موجود مقایسه شده است. با توجه به نتایج این بررسی، موفقیت روش پیشنهادی بر روی پایگاه دادهjsrt، کاملاً مشهود می باشد.
وحید کیانی حمیدرضا پوررضا
رسانه ویدئو بدلیل ارایه همزمان اطلاعات تصویری، صوتی، و متنی پرمحتواترین رسانه دیجیتالی در عصر حاضر است. توسعه سریع تکنیک های فشرده سازی ویدئو، باعث آرشیوکردن گسترده و مداوم اطلاعات ویدئویی در سرتاسر جهان شده است. با افزایش سریع محتوای ویدئویی آرشیو شده در سرتاسر جهان، نیاز شدیدی به سیستم های کارآمد و سریع برای شاخص گذاری، خلاصه سازی و بازیابی ویدئوی فشرده احساس می شود. ویدئوی ورزشی و بخصوص ویدئوی فوتبال پرطرفدارترین نوع ویدئو در جهان است؛ که بخش اعظم تحقیقات محققین را به خود اختصاص داده است. در خلاصه سازی مبتنی بر محتوای ویدئوی فوتبال، پرمحتواترین بخش های ویدئوی فوتبال کشف شده و با ترکیب آنها ویدئوی خلاصه تولید می شود. دو رویکرد اصلی برای خلاصه سازی ویدئوی فوتبال شناسایی رویدادها و کشف بخش های مهم است. اگر چه محققین در تحقیقات خود به نتایج مناسبی در خلاصه سازی ویدئوی فوتبال دست یافته اند، اما سیستم های خلاصه سازی ویدئوی فوتبال بدلیل سرعت کم پردازش ویدئو در آنها هنوز فراگیر نشده اند. در این پایان نامه، روش جدیدی برای خلاصه سازی ویدئوی فوتبال در ویدئوی انکود شده ی mpeg بر اساس کشف بخش های مهم ارایه می شود. استخراج مستقیم اطلاعات تصویری از جریان بیتی ویدئوی فشرده فوتبال، باعث افزایش سرعت روش پیشنهادی شده است. همچنین، تدوین روش های دقیق برای استخراج ویژگیهای معنایی حوزه فوتبال از ویدئوی فشرده، باعث حفظ دقت سیستم پیشنهادی شده است. در سیستم پیشنهادی این پایان نامه، ابتدا اطلاعات سطح پائین تصویری از ویدئوی فشرده استخراج می گردند. سپس رنگ زمین چمن به کمک یک مدل آماری چندگوسی مدل سازی می شود. در مرحله بعد، حرکت دوربین در هر تصویر بر اساس بردارهای حرکت استخراج شده از ویدئوی فشرده و با در نظر گرفتن میزان اعتبار هر بردار حرکت تخمین زده می شوند. پس از آن ویژگیهای معنایی حوزه فوتبال از جمله مرز شات، گذرهای لوگو، صحنه های پخش مجدد، نوع شات، و منطقه بازی از ویدئوی فشرده استخراج می گردند. برای استخراج هر یک از ویژگیهای معنایی مذکور از مدل سازی ویژگیهای سطح پائین استخراج شده از ویدئوی فشرده استفاده می شود. از آنجایی که میزان بلندی صدا در هر صحنه فوتبال می تواند نشاندهنده میزان اهمیت صحنه باشد؛ ویژگی انرژی صدا نیز بعنوان یک ویژگی معنایی از ویدئوی فوتبال استخراج می گردد. در نهایت با ترکیب ویژگیهای معنایی استخراج شده، برای هر صحنه یک مقدار اهمیت تخمین زده می شود و از مقادیر اهمیت مذکور برای رتبه بندی صحنه های ویدئو استفاده می گردد. در آخرین مرحله، سیستم پیشنهادی صحنه های مهم بازی را بر اساس مقادیر رتبه، کشف و تا تکمیل زمان تعیین شده توسط کاربر در خلاصه ویدئویی قرار می دهد. در این پایان نامه به منظور ارزیابی سیستم پیشنهادی، از معیارهای کمی و کیفی مختلفی استفاده شده است. یک پایگاه ویدئویی حاوی شش بازی فوتبال تهیه و بطور دقیق برچسب زده شده است. ابتدا کلیه بخش های مربوط به استخراج ویژگیهای معنایی حوزه فوتبال بصورت کمی ارزیابی شده اند. سپس، برای ارزیابی کمی عملکرد سیستم در رتبه بندی صحنه های بازی از مقایسه رتبه بندی سیستم با رتبه بندی انجام شده توسط کاربران مختلف استفاده شده است. همچنین، به منظور ارزیابی کیفی خلاصه های تولید شده توسط سیستم از نظرات کاربران در مورد ویدئوهای تولید شده استفاده شده است. ارزیابی کمی عملکرد سیستم در رتبه بندی صحیح صحنه های بازی به کمک معیار همبستگی رتبه بندی، برای اولین بار در این سیستم پیشنهادی انجام می شود و می تواند معیار مناسبی برای مقایسه سایر محققین در کارهای آینده ایشان باشد. سیستم پیشنهادی در رتبه بندی صحیح صحنه ها، بطور میانگین به مقدار 8167/0 برای ضریب همبستگی spearman و مقدار 6394/0 برای ضریب همسبتگی tau-b دست یافته است. همچنین از نظر کیفی، خلاصه های تولید شده توسط سیستم از حیث کامل بودن امتیاز عالی و از حیث هموار بودن امتیاز خوب را کسب کرده اند. بر اساس نظر کاربران، با افزایش طول خلاصه از دو دقیقه به ده دقیقه میزان قابل پذیرش بودن خلاصه ها از عالی به قابل قبول کاهش یافته است. در نهایت از نقطه نظر کارایی، سیستم پیشنهادی به سرعت 47 فریم در ثانیه یعنی دو برابر زمان واقعی برای خلاصه سازی ویدئو دست پیدا کرده است. با این وجود، زمینه های زیادی برای توسعه روش پیشنهادی وجود دارند که در بخش آخر پایان نامه به آنها اشاره شده است.
محبوبه وظیفه دار یزد رجبعلی کامیابی گل
در تبدیل تصویر آنالوگ به دیجیتال با استفاده از ابزارهایی مانند دوربین و میکروفن و دستکاه های تصاویر پزشکی، نویزهایی از قبیل نویز الکترونیکی به تصویر اضافه می شوند. هدف در این پایان نامه حذف این نویزها و به دست آوردنf از معادلهy=af+z است که z نویز سفید و a تبدیل رادون است. از آن جایی که عملگرهای پیچش مانند تبدیل رادون به طور کلی قطری نیستند، به همین دلیل از سیستم موجک-وگلت برای قطری کردن این عملگرها استفاده می کنیم و تابع را بر اساس ضرایب موجک-وگلت نمایش می دهیم. در این پایان نامه به کمک یک خانواده از مسائل تغییرات را برای حل y=af+zدر نظر می گیریم. در این روش تابع می نیمم کننده بهf^* وسیله مشخص می شود. اکنون با به دست آوردن این f می نیمم، یک کران بالا برای میانگین خطایf به دست می آوریم و با انجام محاسبات گوناگون و استفاده ار نرم افزارmatlab سعی در به دست آوردن بهترین تصویر داریم.
بشرا رجایی حمیدرضا پوررضا
ناکارا بودن موجک جدایی پذیر در نمایش گسستگی های تصویر، منجر به ظهور تبدیلات دوبعدی متنوعی در بیش از یک دهه اخیر شده است. تبدیلات جدید با ارائه نمایش های جهتی سعی در غلبه بر مشکلات موجک جدایی پذیر دارند. یکی از موفق ترین این تبدیلات که عمدتاً برای فشرده سازی تصویر ارائه گردیده، موجک جهتی است. تبدیل موجک جهتی با تنظیم جهت فیلترهای موجک در راستای لبه های تصویر سعی در کاهش انرژی ضرایب باندهای با فرکانس بالای موجک و در نتیجه افزایش کارایی فشرده سازی دارد. علی رغم موفقیت های چشمگیر تبدیلات موجک جهتی در ارتقا عملکرد فشرده سازهای استانداردی چون jpeg2000، تحلیل های تئوریک موجود در این حوزه محدود بوده و موفق ترین ایده های ابتکاری که اساس آنها بلاک بندی تصویر و تخصیص یک جهت به هر بلاک است، تاکنون مورد تحلیل قرار نگرفته اند. در این رساله،رفتار بهینه موجک جهتی در نمایش لبه های تصویر با استفاده از معیار نرخ-اعوجاجاثبات می شود. همچنین در مطالعه تاثیر الگوریتم بلاک بندی بر موجک جهتی، ثابت می شود الگوریتم بلاک بندی درخت چهارتایی که در الگوریتم های موجک جهتی متعددی مورد استفاده قرار گرفته است، بهینه نبوده و کارایی نرخ-اعوجاج موجک جهتی را کاهش می دهد. بمنظور رفع این مشکل الگوریتم جدیدی تحت عنوان موجک جهتی ابربلاک معرفی شده و هم از دیدگاه تئوریک و هم از نظر عملکرد کمی و کیفی در فشرده سازی تصاویر دنیای واقعی، کارایی آن به اثبات می رسد. به ازای الگوریتم پیشنهادی موجک جهتی ابربلاک و مجموعه کاملی از تصاویر دنیای واقعی بطور میانگین تا 42/0 دسی بل بهبود psnr در مقایسه با موجک جهتی مبتنی بر درخت چهارتایی مشاهده می شود. در این رساله، همچنین نسخه ای از الگوریتم پیشنهادی با قابلیت فشرده سازی کارای لبه های تیز بمنظور کاربردهایی چون فشرده سازی نگاشت های عمق در ویدئوی چندمنظری ارائه گردیده است.
سیده الهه ایمانی حمیدرضا پوررضا
رتینوپاتی دیابتی یکی از دلایل شایع نابینایی در جهان محسوب می شود. انجام معاینات دوره ای و تشخیص بموقع بیماری می تواند مانع از بروز نابینایی شود. معاینات دوره ای شامل تصویربرداری از ته چشم و تحلیل تصاویر توسط افراد متخصص برای مشاهده تغییرات سریع در الگوی عروق خونی و بروز ضایعات مختلف می باشد. این روش معاینه بسیار زمانبر، پرهزینه و نیازمند افراد متخصص می باشد. طراحی سیستمی خودکار برای تشخیص رتینوپاتی دیابتی ضروری می باشد. با این وجود مشکلاتی از جمله عدم کیفیت مناسب تصاویر شبکیه مانع از خودکار بودن کامل یک سیستم غربالگری می شود. زیرا اجزای آناتومی و ضایعات شبکیه در تصاویر با کیفیت نامطلوب به خوبی قابل رویت نمی باشد. بنابراین پردازش چنین تصاویری به منظور تشخیص بیماری، شناسایی ضایعات و اجزای آناتومی با مشکل روبرو شده و سبب کاهش کارایی سیستم غربالگری می شود. چنین تصاویری معمولا به صورت غیرخودکار تشخیص داده شده و مجددا تهیه می شود. هدف ما در این پایان نامه، طراحی یک سیستم غربالگری رتینوپاتی دیابتی کاملا خودکار با قابلیت ارزیابی کیفیت تصاویر شبکیه می باشد. الگوریتم های پیشنهادی ارزیابی کیفی تصاویر شبکیه مبتنی بر ویژگی های عمومی و ویژگی های ساختاری تصویر می باشد. در این روش ها از ویژگی های عمومی تصویر مانند وضوح و اطلاعات ساختاری مانند میزان رویت پذیری عروق خونی برای ارزیابی کیفی تصویر استفاده می شود. همچنین روشی برای غربالگری رتینوپاتی دیابتی ارائه شده است که مبتنی بر اطلاعات ساختاری و مورفولوژیکی تصویر می باشد. با توجه به اینکه اجزای سالم و ضایعات در تصاویر شبکیه از لحاظ ساختاری و مورفولوژیکی با یکدیگر متفاوت هستند، می توان با استفاده از الگوریتم تفکیک محتوای تصویر، عروق و ضایعات تصاویر شبکیه را از یکدیگر تفکیک کرد. سپس با استفاده از ویژگی های بافتی تصاویر ضایعات شبکیه، غربالگری رتینوپاتی دیابتی انجام می شود. برای ارزیابی الگوریتم های پیشنهادی از بانک استاندارد messidor و بانک محلی بیمارستان خاتم الانبیا استفاده شده است. مقادیر sensitivity و specificity حاصل از سیستم پیشنهادی به ترتیب برابر با 92.01% و 95.45% می باشد.
فاطمه فعال حسینی مظلوم مهدی سعادتمند طرزجان
آب سیاه نوعی بیماری است که تعداد زیادی از انسان ها را در سرتاسر دنیا تحت تأثیر قرار داده است. این بیماری منجر به ایجاد تغییراتی بر روی شبکیه چشم فرد بیمار می شود، که ممکن است به کوری فرد بیمار منجر شود. تشخیص زودهنگام بیماری آب سیاه می تواند عوارض بعدی آن را به طور قابل ملاحظه ای کاهش دهد. افرادی که در معرض این بیماری هستند، نیاز دارند تا در زمان بندی های منظم، غربالگری شوند. بنابراین نیاز به یک سیستم تشخیص خودکار بیماری آب سیاه می باشد. از جمله اهداف این گزارش می توان به موارد زیر اشاره نمود: تقطیع خودکار نواحی موجود در شبکیه، بدست آوردن موقعیت و مرز دقیق ناحیه دیسک نوری و کاپ برای محاسبه نسبت cdr، تقطیع لایه rnfl شبکیه در تصویر oct، بدست آوردن قطر لایه rnfl و ناحیه rim از آن و استخراج ویژگی به منظور غربالگری بیماری آب سیاه، که بر اساس دو تصویر oct و شبکیه انجام می گیرد. برای استخراج اطلاعات از تصویر oct، از روش کانتورهای فعال استفاده می شود که توسط آن مرز لایه های شبکیه در تصویر oct بدست می آید. پس ازآن، با استخراج مرز لایه ها، ضخامت هرلایه و نیز تغییرات قطر ناحیه ی rim، تعیین می شود. پردازش تصاویر شبکیه شامل تقطیع کاپ و دیسک نوری و سپس محاسبه نسبت کاپ به دیسک (cdr) است. این سیستم با ترکیب ویژگی های دو تصویر oct و شبکیه قادر است با دقت بالاتری بیماری آب سیاه را شناسایی کند. الگوریتم بدست آمده برای سیستم غربالگری بر روی 46 تصویر oct و شبکیه تست شد که نهایتا دقت الگوریتم قطعه بندی تصویر oct نیز برابر با (4.18±10) پیکسل معادل (1.69±4.32) میکرومتر بدست آمد.
محسن اصغری امرئی حمیدرضا پوررضا
مسأله ی اندازه گیری زوایای سر در بینایی ماشین به کرات مورد بررسی قرار گرفته است. در این تحقیق این مسأله به طور خاص برای کمک به تشخیص بیمارانی مورد بررسی قرار گرفته است که به دلیل مشکل چشم در بینایی، سر خود را از حالت طبیعی و بدون انحراف خارج می کنند تا وضعیت بینایی خود را بهبود بخشند. اما به مرور زمان سر آن ها این حالت غیرطبیعی را حفط می کند و نسبت به حالت طبیعی زاویه پیدا می کند. امروزه برای اندازه گیری زاویه ی سر این بیماران نسبت به حالت طبیعی از ابزار مکانیکی هندسی مانند گونیومتر استفاده می شود. در این جا از یک دوربین کینِکت برای تصویربرداری از بیماران استفاده می شود و زوایای سر بیمار با استفاده از تصویر به دست آمده محاسبه می شود. مزیت این دوربین نسبت به دوربین های معمولی این است که عمق پیکسل های تصویر را نیز در اختیار ما قرار می دهد و استفاده از این مقادیر عمق موجب افزایش در دقت اندازه گیری زوایا می شود. از آن جایی که بسیاری از بیماران را خردسالان تشکیل می دهند، ممکن است به همراه والدین خود در محل تصویربرداری حاضر شوند و بنابراین یکی از شرایط مسأله حضور بیش از یک فرد در تصویر اخذ شده است. برای محاسبه ی زوایای سر، از تصویر rgb و مقادیر عمق بر حسب نیاز استفاده می شود. ابتدا با استفاده از تصاویر rgb، صورت افراد حاضر در تصویر از بقیه ی عکس جدا می شوند؛ سپس با استفاده از مقادیر عمق و این فرض که فرد بیمار نزدیک ترین فرد به تصویر است، صورت فرد بیمار از بقیه ی افراد تمیز داده می شود و ادامه ی الگوریتم بر روی این قسمت از تصویر اجرا می شود. در ادامه ابتدا چشم های فرد در تصویر پیدا می شوند و با استفاده از مکان آن ها زاویه ی roll محاسبه می شود. سپس نقاطی که منتسب به پیشانی هستند استخراج می شوند و با استفاده از مقادیر عمق متناظر با این نقاط، نزدیک ترین صفحه ای که منطبق بر این نقاط باشد محاسبه می شود. و در نهایت با در دست داشتن بردار نرمال صفحه ی پیشانی، زوایای yaw و pitch سر محاسبه می شوند. الگوریتم ارائه شده در نرم افزار مطلب پیاده سازی شده است و برای بررسی صحت عملکرد، از پایگاه داده های تهیه شده در دانشگاه eth سوئیس استفاده شده است. دلیل این مسأله، منطبق بودن شرایط این پایگاه داده ها با شرایط مسأله ی مورد بررسی بوده است. نتایج به دست آمده با روش پیاده سازی شده در [fan 2011b] مقایسه شده است که نتایج به دست آمده، هم از لحاظ میانگین خطای مطلق و هم از نظر انحراف از معیار خطا، بهبود داشته اند. همچنین یک پایگاه داده محلی از تصاویر 8 بیمار که دچار مشکل مورد نظر بوده اند تهیه شد و الگوریتم پیشنهادی بر روی تصاویر این بیماران اجرا گردید که نتایج آن ارائه گردیده است.
سینا رستگار حمیدرضا پوررضا
بازشناسی انسان از ماشین در فضای سایبری و سیستم های خودکار همواره یکی از جالب ترین و در عین حال سخت ترین چالش های پیش روی متخصصان امنیت و پژوهشگران هوش مصنوعی بوده است. شناسایی، بررسی و پیاده سازی الگوریتم ها و ساختارهایی که بتوانند انسان و سیستم های کامپیوتری را به کمک روندی از سوالات تفکیک کنند، همواره در این حوزه مورد بررسی بوده است. استفاده های متعدد امنیتی (برای مثال جلوگیری از انجام عملیات به صورت خودکار و توسط یک روبات اینترنتی) و تعاملی، باعث مهم تر شدن استفاده از ابزارهایی برای بازشناسی انسان از ماشین شده است. یافتن نقاط قوت و تفاوت ادراکی انسان نسبت به ماشین، کلید طراحی این الگوریتم هاست. بر این اساس، از این سیستم ها تحت عنوان آزمون تورینگ عمومی کاملا خودکار برای بازشناسی انسان از ماشین یا captcha نام برده می شود. نکته قابل تامل در مورد کپچا، منطق پیشرفت آن است که در هر صورت مورد تمایل متخصصان امنیت و هوش مصنوعی است: طراحی یک کپچای جدیدتر و مقاوم تر، یک مساله سخت هوش مصنوعی را تعریف می کند که می توان از آن برای امن شدن سیستم های کامپیوتری استفاده کرد، از طرف دیگر حل و شناسایی این کپچا نیز باعث پیشرفت در زمینه ی هوش مصنوعی و الگوریتم های هوشمند خواهد شد. در این پایان نامه با انتخاب رویکردی جدید، به معرفی، طراحی و پیاده سازی یک کپچا مبتنی بر انگاره های بصری می-پردازیم و آن را از جنبه های امنیتی، پیاده سازی و کاربردی بررسی می کنیم. کپچای معرفی شده، با استفاده از انگاره های بصری، یک لایه ی امنیتی بیشتر به کپچا می افزاید و سعی می کند تا پیچیدگی مساله را برای مهاجمین - با حفظ جذابیت برای کاربر – افزایش دهد. در این پایان نامه، برای اولین بار، مدلی برای تولید و اندازه گیری انگاره های رنگی معرفی شده است که با به کارگیری آن، مناطق رنگی مورد نظر در کپچا به صورت انگاره ای تولید می شوند. در نهایت با برگزاری آزمون کپچا در بین 20 شرکت کننده، متوسط زمان پاسخ گویی، 15.64ثانیه و نرخ پاسخ های صحیح %75.6، نشان دهنده ی زمان پاسخ گویی مناسب و درصد پاسخ های صحیح متوسطی است که با توجه به این که این کپچا اولین نمونه در نوع خود (استفاده از انگاره های رنگی تولید شده به صورت خودکار) است، رضایت بخش تلقی می شود. برای کپچای پیشنهادی، نام illucaptcha که برگرفته از لغات illusionary به معنای انگاره ای و captcha است را برگزیدیم.
نجمه نجمی ناصر طیبی
بیماری هایپرپلازی داکتال نرمال مرحله ای پیش سرطانی است که در صورت تشخیص به موقع آن می توان از ابتلای بیمار به سرطان سینه پیشگیری کرد. در این بیماری ویژگی های سلول تغییر کرده و سیکل تولد و مرگ سلول دچار اختلال می شود. یکی از راه های تشخیص این بیماری نمونه برداری بافت با استفاده از سوزن ضخیم و بررسی آن زیرمیکروسکوپ با بزرگنمایی های مختلف است. پزشک در هر بزرگنمایی به بررسی چند ویژگی پرداخته و در نهایت به تشخیص بیماری می پردازد. از آنجایی که تشخیص این بیماری تا حدی وابسته به نظر پزشک است، ایجاد سیستمی خودکار برای تشخیص آن می تواند به پزشک در تصمیم گیری کمک کند. در این پایان نامه هدف ایجاد چنین سیستمی با استفاده از دو تصویر با بزرگنمایی های 40x و 100x است که از هر کدام ویژگی های مورد نظر پزشک استخراج می شود. از تصویر 40x اندازه داکت، فضای بین هسته ای و چگالی سلول ها استخراج می شود. در تصویر 100x روشی مبتنی بر کانتورهای فعال برای تقطیع هسته ها پیشنهاد شده است که دقت تقطیع را افزایش دهد تا بتوان به ویژگی های دقیق تری دست یافت. در ارزیابی انجام شده این روش تقطیع حدود 0.8951دقت دارد. سپس اندازه و حجم هسته و نیز میزان دایروی بودن آن به عنوان ویژگی استخراج می شود. در انتها بردار ویژگی استخراج شده توسط طبقه بند svm طبقه بندی شده است که میانگین دقت آن 85.55% است.
مسعود آقامحمدیان شعرباف محمد مولوی
کالیبراسیون دوربین¬های یک سیستم¬های بینایی ماشین اولین قدم در پیاده¬سازی آنها است. در این پایان¬نامه یک روش کالیبراسیون دو مرحله¬ای بر مبنای یک الگوریتم بهینه¬سازی نوآورانه ارائه خواهد شد. در مرحله اول (کالیبراسیون ایستا)، با استفاده از یک شی ایستای چهار نقطه¬ای، موقعیت اولیه دوربین¬های سیستم¬ تخمین¬زده می¬شود. این عملیات با استفاده از الگوریتم¬های کلاسیک انجام خواهد شد. در ادامه نیز نشان داده خواهد شد که چگونه همپوشانی دوربین¬ها کمک می¬کند که این عملیات با درصد موفقیت¬ بالایی انجام گیرد. در مرحله بعدی (کالیبراسیون پویا) با استفاده از یک شی خطی که بصورت آزادانه در محیط حرکت می¬کند، تخمین¬های اولیه با استفاده از یک الگوریتم بهینه¬سازی غیر خطی بهبود داده خواهد شد. برای بهینه¬سازی، استفاده از الگوریتم لونبرگ-مارکارد در ادبیات مسئله رواج دارد. در این پایان¬نامه، با استفاده از یک الگوریتم بهینه¬سازی نوآورانه بر مبنای جداسازی که کالیبراسیون پویا را به دو مسئله 1) تخمین زوایای اویلر هر دوربین (یک مسئله بهینه¬سازی غیرخطی با بعد سه) و 2) مسئله تخمین بردار جابجایی دوربین¬ها و نقاط 3 بعدی شی پویا (یک مسئله محدب تحت قیود محدب غیر خطی) تفکیک می¬کند، انجام خواهد گرفت. در ادامه، با استفاده از تست¬های شبیه¬سازی و همچنین تست¬های تصاویر واقعی، عملکرد الگوریتم جداسازی با روش کلاسیک لونبرگ-مارکارد مقایسه خواهد شد. نشان داده خواهد شد از آنجا که روش بهینه¬سازی ارائه شده در این پایان¬نامه، دقت مساوی و یا بهتری نسبت به روش کلاسیک لونبرگ–مارکاد دارد و از آنجا که الگوریتم بطور بالقوه قادر است سرعت کالیبراسیون را نیز افزایش دهد، می¬تواند بعنوان جایگزین روش کلاسیک در حل مسائل کالیبراسیون مورد استفاده قرار گیرد.
هما فروغی حمیدرضا پوررضا
شناسایی و تحلیل الگوهای مختلف حرکتی انسان از روی دنباله تصاویر ویدئویی از مواردی است که در دهه های اخیر به شکل فزاینده ای مورد توجه بسیاری از محققان بینایی ماشین قرار گرفته است. یکی از مهم ترین کاربرد های مقوله تحلیل حرکات انسان، در سیستم های نظارتی بصری هوشمند می باشد که هدف آن تشخیص، بازشناسایی و ردگیری اشیاء مشخصی از دنباله تصاویر و به شکل کلی تر فهم و توصیف رفتار آن ها می باشد. چنین سیستم هایی دارای قابلیت های فراوانی می باشند و به شکل گسترده در مواردی نظیر کنترل دسترسی در نواحی خاص مانند پایگاه های نظامی و نهادهای مهم دولتی، تشخیص هویت اشخاص جهت شناسایی افراد مظنون، تحلیل تراکم و بررسی سیل جمعیت در مراکز تجاری و تفریحی و همچنین تشخیص حالات غیرمتعارف مورد استفاده قرار می گیرند. تحلیل فعالیت های فرد حاضر در صحنه به منظور شناسایی و دسته بندی رفتارهای عادی و غیرعادی وی از اهداف مهم سیستم های نظارتی بصری هوشمند می باشد. واضح است که ارائه تعریفی جامع و صریح از حرکت غیرعادی، وابسته به بستر و همچنین موقعیت و شرایطی است که فعالیت ها در آن رخ می دهند؛ اما در حالت کلی می توان حرکت غیرعادی را "حرکتی که از لحاظ زیبایی شناسی غیرمعمول باشد" تعریف نمود. به عنوان مثال حرکاتی شبیه بالا رفتن از نرده در مناطق مسکونی، افتادن بر روی زمین در آسایشگاههای سالمندان و تلوتلو خوردن در مراکز نظامی همگی به نوعی غیرعادی محسوب می گردند. به بیان دیگر هر نوع انحراف در همواری، تقارن و یا تطابق راه رفتن؛ باعث ایجاد یک حرکت غیر معمول خواهد شد. علیرغم تحقیقات گسترده در زمینه تحلیل حرکات انسان، تاکنون بررسی های بسیار محدودی در زمینه تشخیص حرکات غیرعادی انجام شده است. هدف اصلی این پایان نامه، تحلیل و طراحی سیستمی است که با استفاده از تکنیک های بینایی ماشین، عملیات بازشناسایی حرکات انسان، دسته بندی حرکات عادی و غیرعادی و شناخت انواع ناهنجاری های حرکتی را به درستی انجام دهد. بدیهی است که سیستم پیشنهادی این پایان نامه، زیرمجموع های از سیستمهای تحلیل حرکات انسان محسوب می گردد. چنین سیستم هایی شامل چندین گام اصلی میباشند. به منظور تحلیل حرکت رخ داده در پنجره زمانی، در نخستین گام عملیات تقطیع اشیاء متحرک صحنه صورت می پذیرد. درطی این گام، نواحی متناظر با اشیاء متحرک موجود در صحنه تشخیص داده می شوند. سپس درطی گام استخراج ویژگی، شاخص ترین ویژگی هایی که تمایز کافی را بین الگوهای متفاوت حرکتی ایجاد می نماید و علاوه براین در مقابل شرایط عملیاتی مختلف نیز مقاوم می باشند، از دنباله نیم رخ های باینری تشکیل شده، استخراج می گردند. درحالی که اکثر سیستم های تشخیص حرکات غیرعادی، به استخراج یک ویژگی کفایت می نمایند، در سیستم پیشنهادی از ویژگیهای متنوعی استفاده شده است که این امر سبب می شود که اولاً معایب ویژگی ها توسط یکدیگر پوشانده شود، ثانیاً نتایج حاصل از بازشناسایی قابلیت اعتماد بیشتری داشته باشند و ثالثاً مشکلات احتمالی ایجاد شده حین عمل ردگیری مانند تغییرات نور، خطاهای حاصل از تقطیع حرکت بهتر مرتفع گردند. بدین منظور در سیستم پیشنهادی از ویژگی هایی مانند هیستوگرام تصاویر افقی و عمودی بدن، بیضی محاط کننده بدن، مرکزثقل و رأس بدن و همچنین الگوهای زمانی- مکانی استفاده شده است. نهایتاً جهت تشخیص نوع فعالیت صورت گرفته بردارهای ویژگی استخراج شده در گام پیشین، به عنوان ورودی به کلاس بند داده می شوند و بدین ترتیب الگوی حرکتی فرد و همچنین عادی/غیرعادی بودن آن مشخص می گردد. در سیستم پیشنهادی از چهار کلاس بند شبکه عصبی، ova svm، ovo svm و fuzzy weighted svm (که توسط مولف طراحی گردیده است) بهره گرفته شده است. کلاس بند fwsvm جهت تعامل با پایگاه داده های حجیم و حل مشکل پیچیدگی زمانی و فضایی گام تعلیم svm معمول، طراحی شده است. نتایج حاصل از دسته بندی، کارایی مناسب و قابل قبول سیستم را نشان می دهند. همچنین مشاهده شده است که با استفاده از کلاس بند fwsvm نرخ بازشناسایی و همچنین کارایی سیستم، به شکل محسوسی افزایش می یابد. نتایج نشان داده اند که روش fwsvm در مقایسه با روشهای کلاسیک ova svm و ovo svm همواره به نتایج بهتری دست می یابد. با توجه به اینکه یکی از مشکلات شایع سیستم های بازشناسایی حرکات غیرعادی عدم توانایی در ایجاد تمایز بین حرکات ظاهراً مشابه مانند "افتادن واقعی" و "حرکت تعمدی به سمت زمین" می باشد، به نظر می رسد که با استفاده از ویژگیهای مناسب استخراج شده و همچنین کلاس بند قدرتمند طراحی شده، این مشکل به خوبی مرتفع گشته است. نکته آخر اینکه، اکثر پایگاه داده های موجود، دربرگیرنده الگوهای حرکتی محدود و غالباً همسانی می باشند و معمولاٌ ناهنجاری های حرکتی را به خوبی پوشش نمی دهند. همچنین عواملی همانند کم بودن تعداد اشخاص شرکت کننده و ثابت بودن شرایط تصویربرداری از اعتبار چنین مجموعه هایی می کاهد. لذا به منظور رفع کاستی های پایگاه داده های موجود، در این تحقیق تلاش شده است که با در نظر گرفتن مجموعه ای گسترده و متنوع از حرکات انسان و همچنین با همکاری تعداد نفرات قابل قبول با سن، قد، وزن و جنسیت متفاوت مجموعه مناسبی تهیه گردد.
محمدرضا پورشهابی حمیدرضا پوررضا
امروزه بیماری چشمیpco (کدورت کپسول خلفی) یکی از عوارض شایع بعد از عمل جراحی آب مروارید است. نرخ وقوع pco و شدت آن به عوامل مختلفی از قبیل نوع و شکل لنز مصنوعی کاشته شده در چشم(iol) ، تکنیک به کار گرفته شده در عمل جراحی آب مروارید و ... وابسته است. از آن جا که تعیین درجه pco، یک عمل نظری است، تعیین میزان تاثیر این عوامل بر روی نرخ وقوع و شدت pco امکان پذیر نمی باشد. بنابراین سیستمی که به طور کاملا خودکار و بدون اعمال نظر شخصی درجه pco را با دقت و قابلیت اطمینان بسیار خوب مشخص نماید بسیار مطلوب است. در این پایان نامه برای اولین بار سیستم کاملا خودکاری به منظور درجه بندی pco ارائه شده است (این سیستم به دو صورت فازی و غیرفازی پیاده سازی شده است). بعد از تهیه تصویر از کپسول خلفی و انجام پیش پردازش های لازم، ناحیه هدف شناسایی می شود. در مرحله بعد، به منظور استخراج ویژگی ها از تبدیل کانتورلت استفاده شده است. مالتی رزولوشن، محلی بودن مکان و فرکانس، نمونه برداری بحرانی، استخراج ویژگی ها در جهات گوناگون و توابع پایه با نسبت ابعاد متفاوت از مهمترین ویژگی های تبدیل کانتورلت به شمار می آیند. تبدیل کانتورلت از یک گروه فیلترینگ جهتی بر روی جزئیات به دست آمده از هرم لاپلاسی تشکیل شده است. به منظور استخراج لبه های نرم منحنی به طور موثر، می توان از تبدیل کانتورلت استفاده نمود. از آنجاکه تصاویر pco دارای لبه های منحنی زیادی هستند، از تبدیل کانتورلت به منظور استخراج ویژگی ها استفاده شده است. در مرحله تعیین درجه pco از دو روش فازی و غیرفازی استفاده شده است. سیستم پیاده سازی شده به وسیله هر دو روش فازی و غیرفازی با سه سیستم درجه بندی معمول دنیا (که روش های نیمه خودکار هستند) و دو روش نظری استاندارد مقایسه شده است. مقایسه نتایج به دست آمده از سیستم طراحی شده، نشان دهنده قابلیت اطمینان بسیار بالای این سیستم است.