نام پژوهشگر: سکینه اسدی امیری

بهسازی تصاویر به کمک روش اصلاح تطابقی گاما
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود 1389
  سکینه اسدی امیری   علی اکبر پویان

بهسازی تصویر یکی از پیش پردازش های مهم در بسیاری از کاربردها ازجمله تصویربرداری پزشکی، نجومی، و کاربردهای عمومی می باشد. بسیاری از دستگاه هایی که برای گرفتن تصویر، چاپ یا نمایش آن به کار می روند، به علت وجود محدودیت های فنی، تغییر غیرخطی بر روی مقدار پیکسل های تصویر اعمال می کنند که موجب کاهش کیفیت تصویر می شوند. بدین معنی که، پیکسل های تصویر به توان مقدار گاما می رسند. علاوه بر این، از آنجایی که دستگاه-های تصویربرداری قادر به نمایش دقیق رنگ، عمق و بافت اشیا مختلف موجود در تصویر نمی باشند، در عمل مقدار گامای اعمال شده به تمام نواحی تصویر به یک میزان نمی‎باشد. فرآیندی که برای تصحیح این پدیده گاما انجام می-گیرد را "اصلاح گاما" می‎‎گویند. اصلاح گاما باید به‎صورت تطابقی (محلی) روی قسمت های مختلف تصویر انجام شود تا بتواند به خوبی، صحنه اصلی را بازسازی کند. در این پایان نامه، سه روش برای بهسازی تصویر توسط اصلاح گاما به‎صورت تطابقی پیشنهاد می شود. منظور از بهسازی تصویر، بهبود روشنایی، وضوح و جزئیات تصویر است. در روش-های موجود اصلاح گاما، اغلب ضریب گاما به طور یکنواخت در تمام قسمت های یک تصویر تغییر می یابد. ولی همان-طور که گفتیم، از آنجایی که تغییرات گاما در تصویر ممکن است به صورت محلی انجام گرفته باشد، در روش های پیشنهاد شده در این تحقیق، اصلاح گاما به صورت تطابقی انجام شده است. روش پیشنهادی اول، مبتنی بر پنجره گذاری و ویژگی همگنی ماتریس هم رخداد می باشد. در این روش، به منظور اصلاح محلی تصویر، تصویر به پنجره های هم پوشان تقسیم شده و سی گامای مشخص (از 1/0 تا 3 با گام 1/0) به هر پنجره اعمال می شود. یکی از این مقادیر اعمال شده، گامای مناسب هر پنجره می باشد، که این گاما با توجه به ویژگی همگنی استخراج شده از ماتریس هم رخداد هر پنجره به دست می آید. ویژگی همگنی ماتریس هم رخداد، بیانگر میزان جزئیات تصویر می باشد. در فصل 5 نشان خواهیم داد، تصویری که سطوح خاکستری آن به شدت تغییر می‎کند (تصویر با جزئیات زیاد)، دارای مینیمم مقدار همگنی است. از اینرو با توجه به مقدار این ویژگی، می توان به کیفیت تصویر پی برد. بنابراین، گامای مرتبط با مینیمم مقدار همگنی، گامای مناسب هر پنجره می باشد. روش دوم، مشابه روش قبل می‎باشد، با این تفاوت که به جای پنجره گذاری تصویر، از بخش بندی تصویر استفاده شده است. در روش سوم از کلاسیفایر svm، جهت اصلاح تطابقی گاما استفاده شده است. در این روش، پایگاه‎داده‎ای از تصاویر آموزشی با گاماهای مشخص ایجاد شده است. به‎منظور اصلاح محلی تصویر، هر یک از این تصاویر آموزشی به پنجره های هم-پوشان تقسیم بندی می‎شوند. نه ویژگی مرتبط با روشنایی، وضوح و میزان جزئیات تصویر، از هیستوگرام، تبدیل کسینوسی و ماتریس هم رخداد هر پنجره استخراج می گردند. این ویژگی ها بیانگر ماهیت تصویر هستند. بردارهای ویژگی به همراه کلاس گامای مربوطه، برای آموزش به svm داده می شوند. این پنجره گذاری و استخراج ویژگی برای تصویر تست نیز انجام می شود و به svm اعمال می گردد، تا گامای مناسب برای هر پنجره از تصویر تست به‎دست آید. هر سه روش پیشنهاد شده، بر روی تصاویر متنوع طبیعت و پزشکی آزمایش شده اند و نتایج مطلوبی حاصل شده است. همچنین برای ارزیابی الگوریتم های پیشنهاد شده در این تحقیق، نسبت به روش های موجود از معیارهای کیفی و کمی استفاده شده است. نتایج حاصل از این معیارها ، نشان می دهند که هر سه روش پیشنهادی در مقایسه با روش های موجود، دارای عملکرد مناسب تری هستند.

تشخیص ارقام و حروف تایپی انگلیسی بدون محدودیت در اندازه و نوع فونت به کمک شبکه عصبی نگاشت خودسازمانده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق و کامپیوتر 1393
  نجمه صمدیانی   حمید حسن پور

بازشناسی نوری حروف در حوزه های گوناگون مانند تشخیص پلاک خودرو، امنیت(مانند تصدیق گذرنامه)، بارکد و سیستم های بانکی (چک)، نقش مهمی ایفا می کند و تا کنون روش ها و سیستم های متعددی برای تشخیص کاراکترها ارائه شده است. هدف این تحقیق، ارائه ی روشی می¬باشد که بتواند ارقام و حروف تایپی یک زبان را بدون محدودیت در نوع فونت و اندازه، شناسایی نماید. از مهم ترین چالش های سیستم های بازشناسی موجود، این است که دارای تعداد زیادی نمونه ی آموزشی و در نتیجه حجم بالایی از محاسبات هستند؛ زیرا هنگام آموزش هر یک از کاراکترها به چندین نمونه ی آموزشی از آن کاراکتر، نیاز دارد. هم چنین اگر این سیستم ها برای تشخیص کاراکترها با تنوع فونت های بیشتری توسعه یابند؛ خطای تشخیص، افزایش می یابد. بنابراین به سیستم بازشناسی¬ای نیاز داریم که قادر باشد علاوه بر کم بودن تعداد نمونه های آموزشی، در مقابل تغییر فونت، مقاوم بوده و خطای تشخیص آن در ازای افزودن فونت های جدید، تغییر آن¬چنانی نداشته باشد. در این پایان نامه، به بازشناسی ارقام و حروف تایپی انگلیسی می پردازیم. کاراکترهای تایپی در فونت ها و اندازه های مختلف نوشته می شوند که سبب می گردد شکل نوشتاری کاراکترهای مشابه با یکدیگر متفاوت باشد؛ بنابراین به یک سیستم بازشناسی با استخراج ویژگی های مناسب از کاراکترها، نیاز است تا بتواند با درنظر گرفتن این تفاوت ها، کاراکترهای مشابه را تشخیص دهد. در این تحقیق، با استفاده از یک بردار ویژگی ساده- مجموع مقادیر پیکسل های تک تک سطرها و ستون ها- و یک شبکه¬ی عصبی نگاشت خودسازمانده بدون ساختار پیچیده، توانستیم ارقام تایپی انگلیسی را در 30 نوع فونت و 11 اندازه ی متفاوت با دقت 99.47% و حروف تایپی انگلیسی را در 24 نوع فونت و 11 اندازه ی مختلف با دقت 97.73%، دسته بندی کنیم. شبکه¬ی عصبی نگاشت خودسازمانده، معمولاً از فاصله ی اقلیدسی برای مقایسه ی نمونه های یک کلاس استفاده می کند اما در این پایان نامه به جای استفاده از فاصله ی اقلیدسی، معیار شباهت برای مقایسه ی بین بردار مشخصه ی رقم ورودی و وزن نرون¬های مختلف، به کار برده می شود. هم چنین، به جای آموزش چندین نمونه از فونت ها و اندازه های مختلف، تنها یک یا دو نمونه برای آموزش در شبکه¬ی عصبی، مورد استفاده قرار می گیرد.

بکارگیری راهکارهای مناسب پیش پردازش تصویر برای عملکرد بهتر تکنیک های فشرده سازی تصاویر
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1393
  زهرا قیسی   حمید حسن پور

امروزه به¬ دلیل حجم زیاد اطلاعات دیجیتال، فشرده¬سازی تصاویر به عنوان یک نیاز اساسی در سیستم-های بایگانی و ارسال تصاویر مطرح می¬شود. روش¬های زیادی برای افزایش نرخ فشرده¬سازی تصویر ایجاد شده است. اما همچنان افزایش نرخ فشرده¬سازی و حفظ کیفیت تصویر بازیابی شده یک ضرورت محسوب می¬شود. هر یک از الگوریتم¬های فشرده¬سازی موجود بر اساس یک یا چند ویژگی اقدام به شناسایی افزونگی در تصویر و در نتیجه فشرده¬سازی آن می¬کنند. بر همین اساس، هر یک از روش¬های فشرده¬سازی، به ازای تصاویر مختلف، نرخ فشرده¬سازی یکسانی را ارائه نمی¬دهند. نرخ¬های فشرده¬سازی آنها ممکن است به عواملی چون تنوع سطوح خاکستری، هموار بودن تصویر و یکسان بودن مقادیر پیکسل¬های مجاور در تصویر بستگی داشته باشد. بر این اساس، در این تحقیق راهکارهایی ارائه می¬شود که به عنوان یک مرحله پیش-پردازش بر روی تصویر اعمال ¬شوند تا پارامترهای تاثیرگذار مربوطه در آن تصویر را جهت فشرده¬سازی تقویت نمایند. در این پایان¬نامه چهار روش پیش¬پردازش ارائه شده است. پردازش اول بدون اتلاف بوده و در دو گام صورت می¬گیرد. در گام اول، تصویر به بلوک¬های بدون هم¬پوشانی تقسیم شده و بلوک¬ها بر اساس افزایش (کاهش) ضرایب dc، مرتب می¬شوند. در گام دوم، هشت تبدیل هندسی برگشت¬پذیر بر روی تصویر حاصل از گام اول صورت می¬گیرد. از بین تصاویر حاصل، تصویری که منجر به بهترین نتیجه برای فشرده¬سازی می¬شود، انتخاب می¬گردد. این پردازش باعث کاهش دامنه¬ی تغییرات، در نتایج حاصل از محاسبات jpeg شده و نرخ فشرده¬سازی آن را بهبود می¬دهد. در روش دوم، سطوح خاکستری که از نظر مقدار، به هم نزدیک می¬باشند، در یک دسته قرار می¬گیرند. سپس، یک سطح خاکستری به عنوان نماینده¬ برای هر دسته در نظر گرفته می¬شود. مقدار هر سطح خاکستری در تصویر اصلی با مقدار نماینده¬ی مربوط به دسته¬ی خودش، جایگزین می¬شود. دسته¬بندی و انتخاب نماینده به نحوی انجام شده است که خرابی تصویر حداقل باشد. در گام بعد، هیستوگرام تصویر پردازش شده، متراکم می¬شود. این پیش¬پردازش، با حفظ کیفیت تصویر، توانسته نرخ فشرده¬سازی الگوریتم lossless jpeg را بهبود دهد. روش سوم مشابه روش دوم می¬باشد با این تفاوت که تصویر در ابعاد ثابت بلوک¬بندی شده و مقدار پارامتر تعیین¬کننده¬ی تعداد سطوح هر دسته، برای هر بلوک، آگاهانه¬تر و بر اساس سیستم بینایی انسان انتخاب می¬گردد. این پیش¬پردازش باعث بهبود نرخ فشرده¬سازی الگوریتم¬های jpeg2000 و lossless jpegشده است. در روش چهارم، با استفاده از الگوریتم ژنتیک فضای رنگ مناسبی برای فشرده¬سازی هر تصویر به طور مجزا ایجاد می¬گردد. این پیش¬پردازش منجر به بهبود عملکرد الگوریتم cic شده است.