نام پژوهشگر: علیرضا احمدی فرد
جواد عباسی آقاملکی علیرضا احمدی فرد
تطبیق تصاویر از موضوعات پویا و به روز پردازش تصویر و بینایی ماشین به شمار می رود، زیرا در بسیاری از زمینه ها علاقه مند به تشخیص شی خاصی در تصاویر دیگر بنابر کاربرد هستیم. روش های متنوعی در این زمینه ارائه شده اند، ما در این پایان نامه از روش نقاط ویژگی تغییر ناپذیر با مقیاس به منظور استفاده از آنها در تطبیق میان تصاویر بهره گرفته ایم. این نقاط در مقابل تغییرات مقیاس و جهت تغییرناپذیرند و نیز تا حدودی در مقابل تغییرات افاین و تغییر زاویه در عمق از خود پایداری نشان می دهند. از نقاط ویژگی تغییر ناپذیر با مقیاس در موزائیک کردن تصاویر همپوشان بهره گرفتیم، که با توجه به قدرت قابل ملاحظه ی این الگوریتم در انتخاب وانطباق نقاط ویژگی تصاویر، نتایج مناسبی به دست آمد. البته این موزائیک کردن، میان تصاویر هوایی و همچنین میان تصاویر تهیه شده از یک الگو به انجام رسیده است. بحث دیگری که مورد بررسی قرار گرفت تطبیق تصاویر هوایی به منظور هدایت ناوبری تجهیزات پرنده است که با توجه به بررسی و اعمال تغییرات شدید مقیاس نتایج مفیدی بدست آمد. از دیگر موارد مورد بررسی استفاده از الگوریتم نقاط کلیدی تغییر ناپذیر با مقیاس در تطبیق و تشخیص حروف و کلمات یک متن است، در این مورد بررسی های صورت پذیرفته بیانگر این مهم است که روش پیشنهادی منحصر به یک زبان و یک رسم الخط خاص نیست و با بهینه سازی روش ارائه شده می توان از آن در طراحی نرم افزاری در تشخیص حروف و کلمات یک متن که به صورت عکس ذخیره شده است استفاده نمود. در تمامی کارهای صورت پذیرفته نقش رزولوشن یا کیفیت تصاویر مورد استفاده بسیار پر رنگ و مهم به نظر می رسد، زیرا هر چه تصاویر با کیفیت بالاتری داشته باشیم جزئیات بیشتری از آنها در دسترس بوده و در نتیجه نقاط ویژگی با دقت بالاتری استخراج خواهند شد، در نتیجه انطباق میان نقاط کلیدی تصاویر نیز با صحت بیشتری همراه خواهند بود.
سمانه ابارشی علیرضا احمدی فرد
ناحیه بندی تصاویر اولین گام و یکی از مهمترین بخش های یک سیستم بینایی ماشین می باشد. ناحیه بندی تصاویر را می توان در دو حوزه ناحیه بندی اتوماتیک و ناحیه بندی تعاملی بررسی نمود. در این پایان نامه ناحیه بندی تعاملی مبتنی بر گراف کات را مطالعه می نمائیم. موفقیت ناحیه بندی مبتنی بر گراف کات در گرو انتخاب پارامترهای مناسب برای این الگوریتم است. برای هر تصویر مجموعه بهینه ای از پارامترها وجود دارند که به ازای این پارامترها بهترین جواب های ناحیه بندی به دست می آیند. هدف ما در این پایان نامه ارزیابی خودکار نتیجه ناحیه بندی می باشد. برای ارزیابی نتایج ناحیه بندی گراف کات، دو سیستم به کمک کلاسه بندهای adaboost و شبکه عصبی پیشنهادمی کنیم.در هر کدام از سیستم های پیشنهادی ،کلاسه بند توسط مجموعه تصاویر ناحیه بندی شده آموزشی،آموزش داده می شود. کلاسه بند آموزش داده شده قادر به ارزیابی یک تصویر ناحیه بندی شده آزمایشی می باشد. ویژگی های استخراج شده از هر تصویر ناحیه بندی شده چه در فاز آموزش و چه در فاز آزمایش ، شش ویژگی می باشد. این ویژگی ها خواص همگنی نواحی و تمایز مرزها را از لحاظ روشنایی و بافت نشان می دهند.خطای کلاسه بندadaboost در ارزیابی جواب های ناحیه بندی 1.7% و مقدار این خطا برای کلاسه بند شبکه عصبی 0.65 % می باشد.
ارس درگزنی سید علی سلیمانی ایوری
فیلتر ذره ای و جابجایی میانگین دو روش موفق برای ردیابی اشیاء در رشته های تصویری هستند و هردو روش نقاط ضعف و قوتی دارند. مزیت های هر دو روش عبارتند از سرعت ردیابی در روش جابجایی میانگین و دقت ردیابی در روش فیلتر ذره ای. در این پایان نامه قصد داریم به منظور استفاده از مزیت های این دو روش، تلفیقی از هر دو روش فیلتر ذره ای و جابجایی میانگین را پیشنهاد کنیم. این روش تلفیقی که با بکار بردن روش جابجایی میانگین در داخل فیلتر ذره ای باعث حرکت دادن ذره ها به سمت قله های محلی موجود در سطح احتمال می شود، امکان استفاده از ذره های کمتری برای ردیابی دست بصورت دقیق، مقاوم و سریع تر را فراهم می سازد زیرا جابجایی میانگین بکار رفته در فیلتر ذره ای بازده و کارایی نمونه برداری از سطح احتمال را افزایش می دهد. نتایج حاصل از ردیابی دست به روش تلفیقی نشان می دهد که این روش با استفاده از فقط 20% تعداد ذره های مورد نیاز در فیلتر ذره ای و با دو برابر سرعت نسبت به فیلتر ذره ای می تواند دست را با همان دقت و مقاومت فیلتر ذره ای ردیابی کند. هدف ما در نهایت از ردیابی دست با استفاده از روش تلفیقی، تشخیص اشاره دست در زبان اشاره است که این مهم به کمک استخراج مسیر حرکت دست در رشته های تصویری مربوط به دیتابیس زبان اشاره مورد استفاده حاصل می شود.
فرهاد جعفری علی دستفان
یکسوکننده تک فاز یکی از پرکاربردترین تجهیزات مورد استفاده در مدارات الکترونیک قدرت بوده و به همین دلیل طراحی بهینه آن مورد توجه محققان می باشد. ساده ترین و مرسوم ترین روش تهیه انرژی الکتریکی بصورت dc، استفاده از یکسوکننده های دیودی و تریستوری می باشند. با وجود اینکه یکسوکننده دیودی و تریستوری دارای ولتاژ ثابت در خروجی اند ولی به دلیل دارا بودن جریان ورودی سینوسی با thd بالا و ضریب قدرت پایین کاربرد این نوع یکسوکننده محدود می باشد. امروزه با ظهور نیمه هادیهای قدرت سریع از قبیل igbt از یک طرف، و ظهور پردازشگرهای دیجیتال سریع (dsp) از طرف دیگر، به کارگیری روشهای pwm جهت بهبود عملکرد مبدل های قدرت را بیش از پیش امکان پذیر ساخته است. استفاده از یکسوکننده های pwm علاوه برتنظیم مقدار جریان و ولتاژ با سرعت گذرای، با حذف هارمونیک های پایین در امر فیلتر کردن سهولت بوجود آورده و به تبع اندازه فیلتر را به طور چشم گیری پایین می آورد و علاوه از این ضریب قدرت مناسبی را نیز ارائه می نماید. در این پایان نامه با استفاده از یک یکسوکننده pwm تک فاز ولتاژ dc ای با ریپل پایین همراه با جریان ورودی با thd پایین و ضریب قدرت واحد تولید شده است به طوری که به دلیل پایین بودن پهنای باند و سرعت این یکسوکننده از روشی جهت بهبود این مشکل استفاده شده است. در ادامه نیز به دلیل اینکه توابع هدف مد نظر در تضاد با یکدیگر بوده و به عبارتی بهبود یکی باعث خراب شدن دیگری می گردد از روش بهینه سازی الگوریتم ژنتیک استفاده شده است به طوری که با استفاده از این روش بهینه سازی، مقادیر بهینه جهت پارامترها بدست آمده است. جهت شبیه-سازی این مبدل و بهینه سازی پارامترهای آن نیز از نرم افزار matlab استفاده شده و نتایج بدست آمده بیانگر بهبود عملکرد این یکسوکننده می باشد. در انتهای این پایان نامه نیز این یکسوکننده pwm تک فاز با استفاده از یک پردازشگر dsp به نام tms320f2812 ساخته شده و نتایج بدست آمده از ساخت نیز در پایان آورده شده است.
محمد حسام محمودی نزاد حسین مروی
با بهبود تکنولوژی میکروالکترونیک و الگوریتم های تعیین محل و ردیابی صحبت کننده، امروزه می توان از اینگونه سیستم ها، برای مصرف کننده ها و بازارهای تجاری بهره گرفت. همچنین علاقمندی فراوانی برای یک کاربرد جدید در اتاق های مجهز به سنسورهای مختلف معروف به اتاق کنفرانس هوشمند در حال گسترش است. در این تحقیق ما به دنبال تعیین محل لحظه ای افراد صحبت کننده در داخل یک اتاق سمینار می باشیم. باید در هر لحظه مشخص کنیم چند منبع فعال وجود دارد و سپس محل این منابع را در فضای فیزیکی تخمین بزنیم. تعیین محل در شرایط مختلفی نظیر: یک یا چند صحبت کننده به طورهمزمان و اینکه صحبت کننده ها به هر دو فرم ساکن و در حال حرکت، باشند و در حالت های نویزی مختلف، می تواند مورد بررسی قرار گیرد. در ابتدا با شبکه بندی فضای اتاق سمینار و با استفاده از الگوریتم srp-phat محل لحظه ای افراد صحبت کننده را مشخص می نماییم. از اطلاعات جهت سر صحبت کننده ها استفاده شده تا از آرایه های میکروفنی که در راستای مستقیم با جهت سر صحبت کننده قرار دارند استفاده کنیم، و تاثیر انعکاسات گرفته شده از سایر میکروفن ها را تضعیف نماییم. تابع استفاده شده در این الگوریتم را oprod-phat می نامیم. در این بخش یک سیستم برای تعیین محل همزمان چندین صحبت کننده پیشنهاد می گردد، که در آن، توسط یک الگوریتم دو مرحله ای ابتدا با استفاده از یک آستانه تطبیقی بر حسب انرژی هر فریم، فریم های بی صدا را جدا کرده و در ادامه توسط مشخصات همبستگی متقابل بین سیگنال یک جفت میکروفن، در مورد تعیین محل لحظه ای صحبت کننده ها تصمیم گیری می گردد. در ادامه برای کاهش تاثیر نویز زمینه، و افزایش سرعت جستجوی فضای اتاق سمینار و همچنین تعیین محل مناسب تر چند صحبت کننده به طور همزمان، با بخش بندی کردن فضای اتاق، یک میزان فعالیت صوتی را در هر بخش تعیین نموده و در هر فریم زمانی، هدف تعیین بخش های شامل صحبت کننده فعال می باشد. به دلیل وجود نویز متغیر، از یک آستانه وفقی با استفاده از الگوریتم em برای تعیین فعال بودن هر بخش بهره می گیریم. سپس با استفاده از یکی از روش های غیر مستقیم tde، به نام روش li، در بخش های فعال محل صحبت کننده ها را تعیین می نماییم. توسط این ایده می توان روش های دو مرحله ای را برای تعیین چندین منبع صوتی به طور همزمان استفاده کرد. در نهایت به ارزیابی الگوریتم های پیشنهادی می پردازیم. نتایج حاصله عملکرد مناسب الگوریتم های پیشنهادی را در بالا بردن دقت تعیین محل افراد صحبت کننده نشان می دهند. کلمات کلیدی: تعیین محل افراد صحبت کننده، آرایه میکروفنی، تخمین تاخیر زمانی (tde)، اتاق سمینار، روش srp-phat ، جهت سر صحبت کننده
رضا خرقانیان علیرضا احمدی فرد
جداسازی خودکار عروق از تصاویر شبکیه چشم کمک شایانی به متخصصین علوم پزشکی در تشخیص به هنگام بیماری های چشم می کند. از مشکلات اساسی استخراج عروق می توان به حضور نویز، عدم توزیع یکنواخت روشنایی تصویر چشم و تغییر در ضخامت عروق شبکیه اشاره کرد. در کنار این مشکلات تفاوت شدت روشنایی بین نقاطی از تصویر که بر روی عروق باریک قرار دارند و سایر نقاط تصویر بسیار کم است. به این جهت روش های موجود از استخراج درست عروق با ضخامت کم عاجز می باشند. در این تحقیق دو هدف را دنبال می کنیم یکی سعی بر ارائه روشی جهت بهبود نتایج روش های موجود داریم دیگر اینکه می خواهیم تخمین مناسبی از قطر رگها در هر نقطه داشته باشیم. مورد آخر در تشخیص بسیاری از ضایعات چشمی مانند بیماری دیابت کاربرد دارد. الگوریتم پیشنهادی برای استخراج عروق از سه مرحل? اساسی تشکیل شده است. در مر حل? اول که پیش پردازش نامیده می شود به کمک تصحیح گاما و فیلتر بانک موجک گابور که از جمل? فیلتر های جهت دار است کیفیت تصویر را بهبود می دهیم. به کمک این مرحله سطح نویز تصویر کاهش یافته، سطح روشنایی تصویر تصحیح شده و عروق از پیش زمینه متمایز می گردند. در مرحل? دوم اقدام به استخراج خطوط مرکزی رگ ها می نماییم. برای این منظور تصویر را بصورت یک روی? توپوگرافیکی در نظر گرفته و بدنبال استخراج نقاط با ویژگی ناودانی بیرون هستیم چراکه این نقاط مکان هندسی خط مرکزی رگ می باشند. با توجه به اینکه در حضور نویز خطوط استخراج شده منقطع و شکسته می باشند نقاط استخراج شده را به کمک فیلترهای جهت دار به همدیگر پیوند می دهیم. از طرفی در این مرحله توسع? نقاط مرکزی رگ را به نحوی ممکن می سازیم تا زمینه استخراج عروق بسیار باریک فراهم گردد. خطوط مرکزی بدست آمده در مرحل? دوم برای بازسازی عرض رگ وارد مرحل? سوم می شود. در مرحل? سوم از عملگر های شکل شناسی بهره گرفته ایم تا بطور همزمان وجود رگ در جهت های متفاوت و تغییر در قطر آن ها را لحاظ نماییم. از خطوط مرکزی به عنوان نقاط شروع استفاده کرده ایم و از روش گسترش ناحیه باینری برای بازسازی عرض رگ در چند مرحله استفاده نموده ایم. بازسازی عرض رگ در هر مرحله محدود به تصاویر آستانه گذاری شد? بدست آمده از اعمال فیلتر های شکل شناسی است. نتایج حاصل از روش پیشنهاد شده و مقایسه آن با نتایج حاصل از چند الگوریتم مطرح نشان دهنده بهبود در استخراج خودکار رگ های شبکی? چشم می باشد.
سارا اسدالهی بابلی امید رضا معروضی
با رشد روز افزون تقاضا برای برقراری ارتباط مطمئن و پرسرعت به منظور انتقال داده های صوتی و تصویری با حجم بالا بین کاربران مختلف و بصورت بی سیم، مطالعات گسترده ای روی سیستمهای ادغام تقسیم فرکانسی متعامد (ofdm) در حال انجام می باشد. در سیستمهای ادغام تقسیم فرکانسی متعامد (ofdm) تحت کانال های محوشونده، تخمین کانال با ارسال سمبول های راهنما با الگوهای متفاوت انجام می پذیرد. تخمین کانال مدل شانه ای با داده های راهنما شامل دو مرحله است. ابتدا، کانال در فرکانس های داده های راهنما با استفاده از روش کمترین مربعات (ls) تخمین زده می شود و سپس درون یابی ضرایب کانال در زیر حامل های داده های راهنما برای به-دست آوردن پاسخ کانال در زیرحامل های داده با استفاده از روشهای مختلف انجام می گیرد. در این پایانامه می-خواهیم روش متفاوتی را در تخمین کانال سیستمهای ofdmمبتنی بر داده های راهنما نشان می دهیم. در این پایان نامه از یک تخمین گر دو بعدی که مبتنی بر ارسال نماد های راهنما است استفاده می شود که هدف از این کار کاهش احتمال خطا در شرایط محوشدگی با ارسال الگوهای مختلف داده های راهنما می باشد و در نهایت هدف اصلی آن تخمین کانال در دو حوزه زمان و فرکانس می-باشد. بنابراین ابتدا پاسخ فرکانسی کانال در تعدادی از زیر حاملها با درون یابی در حوزه زمان تخمین زده می-شود و سپس با استفاده از این تخمین ها و پاسخ فرکانسی کانال در تمام فرکانس ها بدست خواهد آمد. بدین ترتیب با ارسال تعداد داده های راهنمای کمتر تخمین کانال دقیق تری بدست خواهد آمد همچنین مقایسه ای بین این روش با روش درون یابی فیلتر وینر و روش تخمین با داده های متغیر با درون یابی خطی و splin انجام گرفته است که نتایج آن در این پایان نامه آمده است
صدیقه صدقی علی دستفان
در سال های اخیر استفاده از درایو چندسطحی ماجولار به دلیل مزایای آن گسترش روزافزونی پیدا کرده است و به دلیل آنکه از این نوع درایو در صنایع سنگین و توان بالا استفاده می گردد و قابلیت اطمینان این صنایع از اهمیت بالایی برخوردار است، لذا عملکرد موتور و سیستم درایو آن بدون هیچ گونه وقفه ای مطلوب است. بنابراین تشخیص و رفع خطا در اینورترهای چندسطحی امری ضروری به نظر می رسد. تا کنون روش های متعددی ازجمله استفاده از تبدیل ویولت، تبدیل پارک و تبدیل فوریه به همراه روش های کلاس بندی همچون شبکه عصبی و یا svm جهت تشخیص خطا به کار رفته اند. با استفاده از تحلیل هیستوگرام می توان با پیچیدگی محاسباتی بسیار کمتر و زمان کوتاه تر ویژگی های شکل موج خروجی را استخراج و سپس طی الگوریتمی عملکرد موتور را به حالت متعادل برگرداند. شبیه سازی مدار قدرت اینورتر چندسطحی در محیط نرم افزار psim و شبیه سازی بخش مدولاسیون و نیز تشخیص خطا در محیط simulink/matlab انجام گرفته و بین این دو محیط توسط simcoupler ارتباط برقرار گشته است. در بخش مدولاسیون روش جدیدی پیشنهاد و شبیه سازی شده است و سپس شکل موج های بدست آمده از ولتاژ فاز خروجی وارد سیستم تشخیص خطا شده اند. سپس بردار هیستوگرام این شکل موج ها استخراج شده و پس از آن مشخصه های بدست آمده به شبکه عصبی داده می شود و کلاس بندی خطا انجام می پذیرد. در صورت وجود خطا با توجه به نوع و محل آن عملیات تجدید ساختار به منظور تصحیح عملکرد انجام می گیرد. نتایج بدست آمده نشان می دهد که دقت در تشخیص خطا و کلاس بندی با استفاده از این روش بهبود یافته و زمان کوتاه تری مورد نیاز می باشد و نیز این روش در شرایط نویزی عملکرد مناسبی دارد. کلمات کلیدی: اینورترچندسطحی، مدولاسیون عرض پالس، تشخیص خطا، تحلیل هیستوگرام، شبکه-عصبی
مهدی بابایی علیرضا احمدی فرد
در این پایان نامه هدف شناسایی و جداسازی خودکار توده های کوچک سرطانی (نودول) از تصاویر ct قفسه صدری می باشد که در تشخیص زود هنگام سرطان ریه کاربرد دارد. چنین سیستمی شامل سه مرحله اساسی پردازش اطلاعات می باشد. در مرحله اول تا حد امکان از نویز تصاویر ورودی کاسته و به کمک درون یابی خطی، تصویر حجمی ct متعادل سازی می شود. نهایتاً بافت ریه از سایر بافت های تصویر جدا می شود. برای این منظور از هیستوگرام روشنایی برش های ct و اطلاعات برش های همجوار استفاده نموده ایم. سپس با در نظر گرفتن ویژگی خمش از کانتور ناحیه بدست آمده و عملیات مورفولوژی، بافت ریه با دقت بسیار خوبی جدا می شود. با توجه به اندازه متفاوت نودول ها و تشابه شدت روشنایی آن ها با عروق ریه شناسایی آن ها دشوار می باشد. با توجه به کروی بودن نودول ها در تصاویر حجمی ct در جدا سازی آن ها علاوه بر شدت روشنایی، از شکل هندسی بافت نیز استفاده می نماییم. اغلب روش های مبتنی بر شکل شناسی در فضای سه بعدی اجرا می شوند که به دلیل حجم زیاد اطلاعات تصویری، مستلزم صرف زمان بسیاری هستند. در این پایان نامه آنالیز دو بعدی داده ها در سه جهت مختلف عمود بر یکدیگر پیشنهاد می گردد که کاهش چشمگیری در زمان اجرای الگوریتم دارد. خروجی این مرحله تعدادی نقاط کاندید برای نودول در تصویر حجمی ct می باشد. در نهایت جهت جداسازی نودول ها از بافت ریه، با توجه به نقاط کاندیدی که از مرحله پیش بدست می آیند، از روش آنالیز فضای ویژگی ها استفاده می کنیم. در تشکیل فضای ویژگی از اطلاعاتی چون موقعیت مکانی هر پیکسل حجمی، شدت روشنایی و اطلاعات شکل هندسی بدست آمده از خروجی فیلترهای مرحله قبل، استفاده می شود. جداسازی بافت نودول به کمک روش غیر پارامتریکی انتقال میانگین انجام می شود. مهم ترین نکته در استفاده از این روش تنظیم مناسب پارامتر پهنای باند می باشد که در این پایان نامه روشی جدید جهت انتخاب بهترین پهنای باند پیشنهاد می گردد. قابلیت شناسایی انواع مختلف توده ها، نرخ خطای بسیار کم، دقت در جداسازی و سرعت اجرای بسیار بالا، نوید استفاده عملی از این سیستم در کاربردهای پزشکی را می دهد. کلمات کلیدی: تصاویر ct حجمی، نودول، درون یابی خطی، هیستوگرام شدت روشنایی، خمش، عملیات مورفولوژی، فرآیند انتقال میانگین.
محمد عرب لو علی سلیمانی
پردازش سریع اطلاعات از دیر باز مورد نظر بوده و سعی شده است با ارائه سخت افزار ها و الگوریتمهای مناسب و روشهای برنامه نویسی خاص از جمله پردازش موازی تا اندازه ای به این مهم نائل آیند و با توجه به نیاز هر روز آنرا توسعه دهند. یکی از سخت افزارهایی که جدیداً با پیشرفت تکنولوژی استفاده عملی پیدا کرده اند fpga ها هستند. اکنون با کمک یک یا چندfpga به همراه قطعات جانبی سخت افزار هایی ارائه می گردد که قادرند الگوریتمهایی با بار محاسباتی بالا را اجرا کنند. برای پیاده سازی این الگوریتم ها، بایستی آنها را بصورت موازی تبدیل و با پیکر بندی ساختار درونی fpga چندین پردازنده ساده طراحی و مسئله را بصورت موازی حل کنند. یکی از این مسائل پردازش بلادرنگ سیگنالهای تصویر و ویدئو است که شامل پیاده سازی الگوریتمهای پردازش تصویر می باشد. تکنیکهای طراحی سخت افزار مانند موازی کردن (parallelism) و خط لوله (pipeline) می تواند بر روی fpga توسعه یابند که در یک طرح اختصاصی dsp ممکن نیست. بنابر این fpga ها انتخاب ایده آلی برای پیاده سازی الگوریتم های پردازش تصویر بلادرنگ می باشند. پیاده سازی الگوریتم ها و روشهای بررسی شده در مقالات سالهای اخیر بر روی این پردازنده ها، قابلیت پردازش موازی و استفاده زیاد این تراشه ها در سیستمهای پردازش بلادرنگ (پردازش تصویر و ویدئو، پردازش سیگنالهای رادار، روترهای اینترنت و ...) را نشان می دهند. بعنوان مثال در مراکزی مانند شبکه های رادیویی و تلویزیونی، برنامه های صوتی و تصویری بصورت دائم در حال پخش هستند. در این مراکز نیاز به سیستم های جانبی داریم که عملکرد سیستم ها را از لحاظ فنی بررسی کرده و بصورت گزارش دراختیار کادر فنی قرار دهند. در این عمل صحت و سرعت پردازش محاسبات از اهمیت بسیار ویژه ای برخوردار است. بررسی های محقق حاکی از آن است که در اکثر این سیستم ها از پردازنده های fpga بعنوان یکی از مهمترین هسته های پردازشگر سیستم استفاده می شود. در این پایان نامه پس از طراحی سخت افزار، اقدام به ساخت آن نموده سپس روی نحوه پیاده سازی الگوریتم تشخیص لبه به عنوان یک موضوع مورد مطالعه و ارزیابی عملکرد سیستم متمرکز می شویم. در واقع در این طرح به دنبال طراحی یک سخت افزار با هسته اصلی fpga می باشیم. در کنار آن استفاده از تراشه ها و قطعات دیگر، برای ارتباط با دنیای بیرون از برد نیز مد نظر قرار گرفته شده است. از جمله اهداف پروژه طراحی و ساخت یک برد سخت افزاری با قابلیت بالا، تست سخت افزار و نشان دادن قابلیت آن با پیاده سازی یک الگوریتم لبه یابی، مقایسه میزان کارآیی سیستم با یک pc وتهیه الگوریتمی مناسب جهت تشخیص لبه می باشد. ملاحظات طراحی سیستمهای میکروپروسسوری، طراحی شماتیک و مدار چاپی سخت افزار از جمله مطالب اصلی مطرح شده طرح می باشد. روند کلی طرح پیاده سازی شده بدین گونه است که یک تصویر نمونه توسط نرم افزار matlab خوانده شده و با برقراری ارتباط با پورت سریال مد نظر، اطلاعات را با نرخ معینی و بصورت آسنکرون برای برد ارسال می شود. میکروکنترلر با دریافت داده ها و بصورت بایت به بایت، آنها را در بافری ذخیره می نماید. پس از تکمیل دریافت، میکروکنترلر آنها را برای پردازش در اختیار fpga قرار می دهد. fpga پس از دریافت کامل داده ها و پردازش بر روی آنها، نتیجه را در اختیار میکروکنترلر قرار داده و آن نیز داده های دریافت شده را در بافری دیگری ذخیره نموده و برای ارسال به کامپیوتر و نمایش آماده می نماید. کلمات کلیدی: طراحی سخت افزار، پردازش سیگنال، قطعات برنامه پذیر،fpga،پردازش موازی
زهره نصیری حسین مروی
بیماری های قلبی بنا بر آمارهای سازمان جهانی بهداشت شایعترین علت فوت را در میان سایر بیماری ها به خود اختصاص می دهند. استفاده از الکتروکاردیوگرام (electrocardiogram:ecg) به دلیل اینکه ثبت آن آسان، کم هزینه و در عین حال ثمر بخش می باشد، برای تشخیص بیماری های قلبی کاربرد وسیع و قابل توجهی دارد.برای کاستن از اشتباهات پزشکان و کمک به آنها، می توان از روشهای هوشمند در تشخیص این بیماری ها استفاده نمود. تغییر و اعوجاج در هریک از پارامترهای اصلی سیگنال الکتروکاردیوگرام می تواند نشان دهنده یک بیماری قلبی باشد. در این تحقیق ،روشی جدید با استفاده از تبدیل والش برای طبقه بندی آریتمی های قلبی پیشنهاد شده است. هدف اصلی این تحقیق، بدست آوردن روشی اتوماتیک ، کارا و سریع, جهت تشخیص و تفکیک بیماری های قلبی بلوک شاخه ای راست ، بلوک شاخه ای چپ ، پیس ریتم و انقباضات زودرس بطنی4 و حالت نرمال از یکدیگر می باشد. به منظوراستخراج ویژگیها و کاهش ویژگیهای سیگنال قلب از طیف والش استفاده شده است .با استفاده از طیف والش ویژگی های مناسب از سیگنال قلب استخراج شده است .آزمایشات روی دیتابیس "mit_bih" 5 انجام شده است و در نهایت نمونه های انتخاب شده به یک طبقه بندی کننده svm داده می شود و ضربان های متفاوت در هر یک از گروه ها دسته بندی می شوند.آزمایشات انجام شده بر روی دیتابیس مذکور نشان دهنده موفقیت روش پیشنهادی در جهت کاهش ویژگی می باشد.
فرشته تاج نیا علیرضا احمدی فرد
امروزه تشخیص و درمان زودهنگام سرطان سینه یکی از دغدغه های اساسی پزشکان و رادیولوژیست ها می باشد. تشخیص سرطان سینه در مراحل ابتدایی بیماری باعث افزایش امید به زندگی شده و بیمار را برای مراجعه بعدی درمان آماده می کند. 95% کسانی که سرطان آن ها در مراحل ابتدایی (یعنی زمانی که سرطان فقط در بافت سینه و یا بافت های زیرین آن قرار داشته باشد) تشخیص داده شده است، بیش از 5 سال از زمان تشخیص زنده مانده اند. در حال حاضر ماموگرافی تنها روش تصویربرداریِ مورد استفاده و موثر برای تشخیص سرطان سینه می باشد. micro-calcification ها یا به طور مخفف، mcها، رسوب های کوچک کلسیم هستند که به صورت نقاط روشن کوچکی در تصاویر ماموگرافی دیده می شوند و نشانه ای از بیماری سرطان سینه می باشند. در این تحقیق هدف طراحی، شبیه سازی، بررسی و مقایسه سیستم های cad می باشد که قادر به تشخیص mc ها در تصاویر ماموگرافی با دقت بالایی باشند. هدف یک سیستم cad تشخیص و پیدا کردن ناهنجاری ها و ناحیه های مشکوک در ماموگرام های دیجیتال با استفاده از کامپیوتر و کمک به رادیولوژیست هاست. هدف از این تحقیق، بررسی چند سیستم cad و معرفی روش های تشخیص mc است که در این سیستم ها پیشنهاد، پیاده سازی ودر نهایت تحلیل و مقایسه شده است. تفاوت اصلی سیستم-های cad طراحی شده و شبیه سازی شده در این تحقیق در مرحله استخراج ویژگی از تصاویر ماموگرافی و همچنین کلاسه بند استفاده شده جهت تشخیص mc ها می باشد. استفاده از ویژگی های آماری و فرکانسی به جای ویژگی های روشنایی تصویر و مقایسه نتایج آن ها با استفاده از کلاسه بند های svm و nn عمده کار انجام شده در این تحقیق می-باشد. در نهایت با آزمایشات انجام شده نتیجه شده است که سیستمِ cad با استفاده از ویژگی های آماری و فرکانسی و svm بهترین نتیجه ی خروجی را در تشخیص مناطق mc، در تصاویر ماموگرافی دارد. در این رابطه همچنین راهکارهایی جهت بهبود کیفیت تصویر ماموگرافی و بهبود تشخیص mcها داده شده و در آخر روشی برای جداسازی هر mc از بافت های مجاور ارائه گردیده است.
معصومه رسول پور مهدی بانژاد
رله های دیفرانسیل از حفاظت های اصلی و اولیه ترانسفورماتور قدرت هستند. بنابراین عملکرد صحیح و سریع این ادوات دارای اهمیت خاصی می باشد. در برخی موارد عملکرد نادرست رله دیفرانسیل رخ می دهد که به دلیل جریان های هجومی، اشباع ترانسفورماتورهای جریان، اضافه تحریک ترانسفورماتور و جریان تفاضلی ناشی از عدم تناسب نسبت ترانسفورماتورهای جریان به واسطه عملکرد تپ چنجر ترانسفورماتور می باشد. در میان این دلایل تأثیر جریان هجومی مهم ترین عامل خطای عملکرد رله دیفرانسیل می باشد. به همین دلیل مطالعات زیادی جهت ارائه روش های تشخیص جریان هجومی از جریان خطای داخلی در ترانسفورماتور قدرت صورت گرفته است. در این پایان نامه نیز به منظور جلوگیری از عملکرد نادرست رله دیفرانسیل، یک روش جدید برای تشخیص جریان هجومی ارائه می شود. در روش پیشنهادی از یک ابزار پردازش سیگنال به نام تبدیل موجک استفاده می شود. الگوریتم پیشنهادی بر اساس ویژگی های استخراج شده از تحلیل زمان- فرکانسی تبدیل موجک می باشد. تحلیل موجک منجر به ایجاد مولفه های فرکانسی متغیر با زمان، در سطوح فرکانسی مختلف می شود. بررسی های انجام شده در این پایان نامه، روی توزیع انرژی این مولفه ها در سطوح فرکانسی مختلف، نشان دهنده اختلاف انرژی بین جریان هجومی و جریان خطای داخلی در سطوح فرکانسی می باشد. این تفاوت جهت متمایزسازی جریان های خطا و هجومی استفاده می شود. به منظور ایجاد یک الگوی مناسب و استفاده از آن در الگوریتم پیشنهادی از یک معیار آماری به نام ضریب همبستگی استفاده می شود. فاکتور ضریب همبستگی برای بیان ارتباط بین انرژی های ضرایب تبدیل موجک در سطوح فرکانسی مختلف به کار می رود. بر این اساس یک معیار تشخیص ایجاد شده و برای جلوگیری از عملکرد رله دیفرانسیل در مورد جریان هجومی به کار می رود. نتایج حاصل از شبیه سازی و تست آزمایشگاهی صحت روش پیشنهادی را تأیید می کنند.
الهام بایسته تاشک علیرضا احمدی فرد
در این پایان نامه بازشناسی برون خط کلمات دست نوشته فارسی در یک فرهنگ لغت محدود مورد مطالعه قرار می گیرد. برای این منظور یک روش دو مرحله ای پیشنهاد می گردد. در مرحله نخست توسط الگوریتم های خوشه بندی سلسله مراتبی وisoclus کلمات موجود در فرهنگ لغت بر اساس تشابه خوشه بندی می شوند. ویژگی های تشابهی به کار رفته در این مرحله، بردارهای پروفایل بالا، پایین، پروژکشن عمودی و تعداد گذر از سیاه به سفید برای هر ستون تصویر است. برای کاهش ابعاد ویژگی های استخراج شده و محدود کردن آشفتگی این سیگنال ها از تبدیل موجک یک بعدی استفاده شده است. برای اندازه گیری تشابه بردارهای ویژگی های دو کلمه از معیار فاصله dtw استفاده می کنیم. میانگین هر خوشه در فضای ویژگی ها به عنوان نماینده آن خوشه و مدخل مشترک اعضای آن خوشه در فرهنگ لغت تصویری، در نظر گرفته می شود. تعداد کلمات موجود در فرهنگ لغت مورد مطالعه 16000 کلمه از 503 شهر ایران می باشدکه "ایران شهر" نام دارد. در این مرحله کلمات دست نوشته در 62 خوشه قرار می گیرند. در مرحله شناسایی کلمه ورودی، با انتخاب 5 خوشه نزدیک به کلمه دست نوشته مورد آزمون با دقت 94% حدود 77% از کلمات مورد بررسی کاهش خواهد یافت. در مرحله دوم بازشناسی، یکی از کلمات کاندید بدست آمده از مرحله اول می بایست بعنوان کلمه مورد آزمون تشخیص داده شود. در این مرحله از ویژگی هیستوگرام گرادیان روشنایی محلی استفاده می کنیم. برای این منظور گرادیان تصویر کلمه ورودی بلوک بندی می شود. در این پایان نامه دو روش بلوک بندی تطبیقی برای بهبود عملکرد بازشناسی پیشنهاد می گردد. در روش اول اندازه بلوک ها بر اساس توزیع پیکسل های سیاه (قلم) تنظیم می شوند و در روش دوم اجزاء اصلی کلمات دست نوشته به طور جداگانه بلوک بندی و سپس با هم ترکیب می شوند. بردارهای ویژگی مبتنی بر گرادیان کلمه ورودی با بردارهای ویژگی حاصل از کلمات کاندید در فرهنگ لغت در یک طبقه بند مقایسه می شوند. برای این منظور از کلاسه بندهای k نزدیکترین همسایه و svm چند کلاسه استفاده می شود. نتایج بازشناسی کلمات دست نوشته پایگاه داده "ایران شهر" نشان می دهد که مرحله کاهش کاندید ها در فرهنگ لغت باعث افزایش نسبی دقت و سرعت می شود. این به دلیل حذف کلمات نامتشابه در بازشناسی کلمه دست نوشته مورد بررسی است. همچنین روش پیشنهادی بلوک بندی تطبیقی در استخراج ویژگی هیستوگرام گرادیان محلی باعث بهبود 13 درصدی دقت سیستم بازشناسی می شود.
علی سنچولی مهدی بانژاد
تجهیزات دریایی تمام الکتریک به تازگی وارد صنعت و تجارت شده اند و تا قبل از آن سیستم برق آنها تنها بار های کوچکی را تأمین می نمود. با روی کار آمدن این تجهیزات ، وجود سیستم قدرت مجهز و با قابلیت اطمینان بالا ، امری اجتناب ناپذیر گشته است. مطالعاتی در مورد این سیستم قدرت جدید انجام شده ولی تعداد آن ها بسیار اندک است و هنوز این سیستم نیاز به تحلیل و بررسی های بیشتر و گاهاً نوآوری و تغییرات اساسی دارد.یکی از ویژگی های سیستم قدرت تجهیزات دریایی عدم وجود سیستم earthing است که این امر باعث ناتوانی رله ها در تشخیص خطای تکفاز به زمین می گردد.که اگر خطای تکفاز به زمین دیگری رخ دهد موجب رخداد خطای دوفاز به هم شده در این صورت رله ها تریپ داده و بار های حیاتی قطع می گردند(همانطور که می دانید قطع بار های ضروری موجب به خطر افتادن جان پرسنل می شود). در این مقاله قصد بر این است تا با استفاده از تبدیل موجک و ابزار های هوشمند (شبکه های عصبی و . . . ) ، وقوع خطای تکفاز به زمین در سیستم قدرت تجهیزات دریایی تشخیص داده شود.
حبیبه قاهری علیرضا احمدی فرد
یکی از موضوعاتی که در سال های اخیر مورد توجه بسیاری از محققین قرار گرفته است، سیستم های واسط مغز و رایانه (bci) می باشد. bci سیستمی است که به کمک سیگنال های مغزی نظیر الکتروآنسفالوگرام (eeg، ارتباط بین شخص و وسایل جانبی مثل دست مصنوعی را برقرار نماید. در bci مبتنی بر تصور حرکتی از شخص خواسته می شود تا تصور کند که بخشی از بدن خود را حرکت می دهد. در نتیجه تصور حرکت رخدادهایی در مغز اتفاق می افتد. وظیفه سیستم bci این است که این رخدادها را از سیگنال های eeg استخراج نموده و براساس آنها نوع حرکت را تشخیص دهد. هدف از این پایان نامه کلاسه بندی داده های eeg ناشی از چهار نوع تصور حرکتی دست چپ، دست راست، دو پا و زبان در مغز می باشد. در این پایان نامه از مجموعه 2a از پایگاه داده مسابقه چهارم bci که در سال 2008 برگزار شده استفاده شده است. در این پایان نامه چهار روش برای کلاسه بندی داده های این مجموعه داده پیشنهاد شده است. یکی از موفق ترین روش ها در تشخیص تصور حرکتی روش csp می باشد. این روش به کمک ماتریس کواریانس داده ها در کلاس های مختلف فیلترهای فضایی استخراج می کند تا داده های ورودی را کلاسه بندی نماید. مشکل csp این است که ساختار زمانی سیگنال های eeg را در نظر نمی گیرد. از طرفی نویز یک نمونه زمانی می تواند تأثیر مخربی بر نتیجه این روش داشته باشد. روش بهبود یافته ltcsp ساختار زمانی داده ها را در نظر گرفته و تأثیر نویز در نتیجه آن کمتر از csp است. این روش اولین بار برای کلاسه بندی داده های دو کلاسه مطرح شده که در این پایان نامه توسط تکنیک ovr به مسئله چهار کلاسه تعمیم یافته است. همچنین ما در این پایان نامه روشی به نام seg-csp-var پیشنهاد داده ایم که در آن ابتدا سیگنال های eeg به قطعات زمانی شکسته شده و سپس بر روی هر قطعه زمانی روش csp اعمال می شود. این روش پیشنهادی بطور متوسط نتایج بهتری از روش csp دارد. نتایج این روش نشان می دهد که اهمیت کانال ها برای جداسازی کلاس ها در قطعات زمانی مختلف متفاوت است. در روش پیشنهادی دیگر با نام seg-csp-bp به جای ویژگی واریانس از توان در باندهای فرکانسی متفاوت به عنوان ویژگی استفاده می شود. در این روش از تکنیک گسسته سازی چند بازه ای به عنوان کلاسه بند و از تکنیک رتبه بندی ویژگی ها به منظور کاهش ابعاد بردار ویژگی استفاده شده است. عملکرد بهتر روش ovr-seg-csp-bp نسبت به روش ovr-csp، ovr-ltcsp، ovr-seg-csp-var و حتی برنده مسابقه 2008 در کلاسه بندی داده های eeg چهار کلاسه حاکی از آن است که استفاده از ویژگی های حوزه زمان و حوزه فرکانس در کنار هم می تواند منجر به نتایج مطلوبی شود. بنابراین در انتهای پایان نامه روشی پیشنهاد داده ایم که در آن از توزیع زمان-فرکانس کانال ها در روش csp استفاده می شود. در این روش تابع چگالی احتمال مولفه ها در حوزه زمان-فرکانس توسط مخلوط توابع گوسی بدست می آید. این روش نیز نتایج بهتری نسبت به روش csp داشته است.
صالحه زهرودی امیدرضا معروضی
یکی از مهمترین حوزه های پژوهشی در سیستم های حمل و نقل هوشمند، توسعه سیستم هایی است که جریان ترافیک در تقاطع ها را بصورت اتوماتیک مشاهده و کنترل می کنند. این سیستم ها علاوه بر تحلیل جریان حرکتی، می بایست تمامی جزئیات حرکتی هر وسیله نقلیه مانند موقعیت و سرعت را ثبت نمایند. در این پایان نامه روشی جدید برای به حداقل رساندن خطاهای ناشی از فرآیند شناسایی و ردیابی خودرو در صحنه های شلوغ همانند تقاطع ها و جاده های درون شهری که همپوشانی بین خودروها و پیچیدگی حرکات بیشتر از بزرگراه ها و جاده های برون شهری می باشد، ارائه شده است. در روش پیشنهادی به منظور تشخیص وسایل نقلیه متحرک از روش مدل ترکیبی گوسی جهت استخراج اشیاء متحرک موجود در تصویر ورودی استفاده می شود و در ادامه برای حذف غیر خودرو از خودروهای شناسایی شده و همچنین تقویت خروجی مرحله تشخیص از روش ماشین بردار پشتیبان، که به عنوان قوی ترین الگوریتم طبقه بندی مطرح می باشد استفاده خواهیم نمود. برای ورودی ماشین بردار پشتیبان نیاز به بردار ویژگی قدرتمندی برای تمایز خودرو از غیر خودرو داریم که نسبت به جهت و اندازه خودرو مستقل باشد. به همین منظور از توصیف گر هیستوگرام گرادیان های جهت دار (hog ) استفاده می نماییم. برای رفع مشکل همپوشانی خودروها، سیستمی جهت تشخیص همپوشانی پیشنهاد شده است که با استفاده از شکل ظاهری و مشخصات مورفولوژیکی خودروها، مکان همپوشانی را تشخیص داده و به منظور جداسازی خودروهای داخل ناحیه همپوشانی، از یک مدل svm که با استفاده از تصاویری با اندازه های گوناگون آموزش دیده است، استفاده می نماید. سپس خروجی این مرحله به واحد ردیابی که بر پایه فیلتر کالمن و الگوریتم ردیابی فرضیات چندگانه استوار است وارد خواهد شد. سیستم پیشنهادی ما می تواند، مشکلاتی از قبیل همپوشانی جزئی و تشخیص خودروها در صحنه های پیچیده را برطرف نماید. پیاده سازی ها با استفاده از پایگاه داده های مختلف در شرایط گوناگون جوی از تقاطع ها، مورد بررسی قرار گرفته است. خروجی نهایی سیستم فوق عملکرد مناسبی را با میانگین درصد تشخیص 9/76 % ارائه داده است.
محمود سیف الهی بهزاد تخم چی
چاه نمودارهای تصویری، ابزارهایی مقاومتی، صوتی، نوری و ... هستند که برای آشکارسازی ویژگی های سنگ در مخازن کربناته از آن ها استفاده می شود. یکی از ویژگی های مهم سنگ، شکستگی است که می تواند به وسیله چاه نمودارهای تصویری تشخیص داده شود. شکستگی ها نقش بسیار مهمی را در حرکت سیال و پایداری دیواره چاه دارند. در این پایان نامه به کمک الگوریتم های هوشمند پردازش تصویر و شناسایی الگو، تکنیکهایی برای شناسایی و ردیابی شکستگی ها در چاه نمودارهای تصویری ارایه می شود. پیاده سازی الگوریتم پیشنهادی بر روی چاه نمودارهای تصویری نمونه نتایج قابل قبولی را نشان داد. بخش بندی چاه نمودارهای تصویری موجود با دلیل تکیه بر اطلاعات رنگ به وسیله شبکه عصبی خودسازمانده به دقت 5/94% حاصل شد. الگوریتمهای پیشنهادی بر چاه نمودارهای تصویری الکتریکی و برای آشکارسازی و ردیابی شکستگی های طبیعی باز متمرکز شده اند.
محسن صدیقی ناو حسین خسروی
انتخاب ویژگی و کاهش ابعاد داده امری مهم و قابل توجه در بازشناسی الگو می باشد که در سالهای اخیر توجه زیادی بر آن بوده است. این امر باعث افزایش سرعت پردازش در سیستم های بلادرنگ و کاهش حافظه برای ذخیره سازی اطلاعات می شود. در این راستا نقش الگوریتم های بهینه سازی خصوصاً الگوریتم بهینه سازی توده ذرات قابل توجه بوده است. به طوریکه با استفاده از الگوریتم بهینه سازی توده ذرات و انتخاب روش مناسب جهت محاسبه مقدار برازندگی در pso می توان تا مقدار قابل توجه ای ابعاد بردارهای ویژگی را کاهش داد تا به نتیجه قابل قبول و بهتر دست یابیم. در این پایان نامه یک سیستم بازشناسی الگو برای بازشناسی ارقام دستنویس ارائه شده است. در این سیستم پس از استخراج ویژگی با استفاده از ترکیب دو روش هیستوگرام گرادیان و مکان مشخصه توسعه یافته بر روی تصاویر ارقام دستنویس مرحله انتخاب ویژگی انجام گرفته است. در بلوک انتخاب ویژگی از الگوریتم بهینه سازی توده ذرات باینری bpso و طبقه بند ماشین بردار پشتیبان svm جهت محاسبه مقدار برازندگی استفاده شده است. همچنین از داده های چهره پایگاه orl، اثر انگشت fvc2004 و داده های uci برای تایید کارایی سیستم استفاده شده است. طبق نتایج بدست آمده برای بازشناسی ارقام دستنویس فارسی بدون کاهش ویژگی به نرخ بازشناسی 99.40% و با استفاده از bpso در انتخاب ویژگی تا 193 ویژگی از 400 ویژگی بردار اصلی به نرخ بازشناسی 99.11% دست یافتیم. این نتایج نشان از عملکرد خوب و قابل قبول سیستم پیشنهادی دارد.
مهدی پرهیزکاری حسین خسروی
اثرانگشت یکـی از مهمترین شاخص های فیزیولوژیکی است کـه برای تعیین هویت افراد استفاده می شـود. روش های مختلفی برای شناسایی اثر انگشت ارائه شده است. در این پایان نامه پس از بررسی روش های مختلف ارائه شده در زمینه تشخیص اثر انگشت و نتایج بدست آمده برای آن ها، روش های جدیدی معرفی شدند. در روش اول از فیلتر گابور و قطاع بندی جدیدی برای تشخیص اثر انگشت استفاده شد به این ترتیب که در تصویر ورودی پس زمینه حذف شد و کیفیت تصویر بهبود داده شد سپس درتصویر بهبود یافته مرکز اثر انگشت پیدا شد. ناحیه ای حول مرکز اثر انگشت جدا شد و این ناحیه توسط فیلتر گابور در 8 جهت فیلتر شد و 8 تصویر بدست آمد که همه تصاویر نرمالیزه شدند. در تصاویر نرمالیزه شده از قطاع بندی جدیدی استفاده شد که میانگین و واریانس در هر قطاع به عنوان ویژگی استخراج شد. این روش بدلیل استفاده از فیلتر گابور به مدت زمان زیادی برای استخراج ویژگی و شناسایی نیاز داشت. در روش دوم از الگوریتم سوبل- رابرتز برای استخراج ویژگی استفاده شد که نسبت به روش اول زمان بسیار کمتری نیاز داشت بدین ترتیب که در تصویر ورودی پس زمینه حذف شد و کیفیت تصویر بهبود داده شد سپس درتصویر بهبود یافته مرکز اثر انگشت پیدا شد و تصویر بهبود یافته را حول مرکز اثر انگشت 5 بار با گام های 22.5 درجه از 45- تا 45+ درجه چرخاندیم و در هر بار چرخش ناحیه ای به مرکز اثر انگشت جدا شد. این نواحی جدا شده نرمالیزه شدند و در تصاویر نرمالیزه شده با استفاده از ویژگی های سوبل - رابرتز بردارهای ویژگی بدست آمد. در روش سوم برای کاهش بیشتر زمان نسبت به روش دوم بجای استفاده از الگوریتم سوبل- رابرتز روی تصویر بهبود یافته، ابتدا با استفاده از تبدیل موجک گسسته دو بعدی روی تصویر بهبود یافته تصویر تقریب بدست آمد سپس از الگوریتم سوبل- رابرتز روی تصویر تقریب استفاده شد. در سه روش قبلی تعداد ویژگی های غیر مطلوب و قابل حذف کردن زیادی وجود داشت بنابراین در گام بعدی از الگوریتم bpso برای کاهش ویژگی استفاده شد که این الگوریتم روی روش دوم که دارای بهترین کارآیی بود، اعمال شد. برای شناسایی در هر کدام از روش ها از دو روش فاصله اقلیدسی و شبکه ماشین بردار پشتیبان استفاده شد. نتایج بدست آمده نشان می دهد که در بین سیستم های پیشنهادی سیستم دوم دارای بهترین کارآیی، سیستم سوم دارای کمترین زمان شناسایی و سیستم چهارم دارای کمترین تعداد ویژگی همراه با درصد شناسایی مطلوب می باشد. برای این پایان نامه از مجموعه داده fvc2004 استفاده شده است.
رویا سلطانی هادی گرایلو
چکیده امروزه در سازمانهای دولتی/غیر دولتی بسیاری در اقصی نقاط دنیا، داده های ویدیویی بسیاری به صورت روزافزون در حال تولید، ذخیره، و ارسال است. نگهداری یا ذخیره ی چنین حجم انبوهی از دنباله های ویدیویی مستلزم استفاده از حافظه های با حجم بسیار زیاد است که چندان مقرون به صرفه نبوده و علاوه بر این حجم فیزیکی نسبتاً زیادی اشغال می شود که منجر به مشکل شدن جابجایی و دسترسی به داده های مذکور می شود. یک راه برای غلبه نسبی بر مشکل نگهداری یا ذخیره ی دنباله های ویدیویی استفاده از روشهای موثر فشرده سازی ویدیو می باشد. ایده ای که مدت زمان زیادی از ارائه ی آن نمی گذرد، فشرده سازی داده های ویدیویی مبتنی بر نواحی مطلوب (roi) است. این ایده در کاربردهایی مورد استفاده قرار می گیرد که در آنها، تمام نواحی یک تصویر یا فریم از اهمیت یکسانی برخوردار نمی باشند. در این گونه تصاویر، نواحی بااهمیت تر با میزان فشرده سازی کمتر (و در نتیجه با میزان کیفیت بیشتر) و نواحی کم اهمیت تر با میزان فشرده سازی بیشتر (و در نتیجه با میزان کیفیت کمتر) کدگذاری می گردند. ایده ی کدگذاری مبتنی بر نواحی مطلوب در تصاویری مانند تصاویر پزشکی، سیگنالهای حیاتی، تصاویر ورزشی، و تصاویر پرسنلی قابل استفاده است زیرا در این گونه تصاویر تمام نواحی تصویر از یک درجه ی اهمیت برخوردار نبوده و برخی نواحی بیشتر از بقیه مورد توجه می باشند. در این پایان نامه، روشی جهت فشرده سازی دنباله های ویدیویی ورزش فوتبال مبتنی بر نواحی مطلوب پیشنهاد شده است. در این راستا، سعی در شناسایی نواحی مطلوب و سپس کدگذاری مناسب هر ناحیه با توجه به میزان اهمیت آن داریم. در روش پیشنهادی از تبدیل موجک و کدگذاری ضرایب آن به کمک کدگذارهای spc (به ویژه کدگذارهای spiht و ebcot) استفاده شده است. مهمترین اجزا و یا تکنیکهای استفاده شده عبارتند از دسته بندی فریمها به دو نوع مستقل و وابسته و کدگذاری جداگانه ی هر کدام از آنها، استفاده از روش پیشنهادی جهت تعیین نوع هر فریم ورودی، استفاده از انطباق بلوکی در دو حوزه ی مکان و تبدیل، و نیز استفاده از بازچینی بلوکها جهت افزایش کارایی کدگذارهای spc، و بالاخره، تعریف و تعیین نواحی مطلوب در تصاویر ورزش فوتبال. کارایی فشرده سازی روش پیشنهادی با کارایی استانداردmpeg4 و روش غیراستاندارد اما امروزی flvبرطبق معیارهای psnr، بیت بر پیکسل (bpp)، و بیت بر ثانیه (bps) مقایسه شده است. نتایج انجام شبیه سازیها از برتری گاهاً قابل توجه روش پیشنهادی نسبت به روشهای مذکور حکایت دارد.
هادی تقی زاده علیرضا احمدی فرد
در این تحقیق روشی برای تشخیص دستنوشته برخط فارسی مبتنی بر قطعه بندی زیر-کلمه به حروف و شناسایی حروف قطعه بندی شده با استفاده از مدل مخفی مارکوف گسسته ارائه شده است. تصویر متن تایپی یا دستنوشته به دلیل این که به صورت یکجا و بعد از نوشتن کامل آن در دسترس است برون خط نامیده می شود در حالی که دستنوشته دریافت شده توسط وسایل دیجیتال نظیر تبلت و تلفن همراه با صفحه لمسی به دلیل در دسترس بودن اطلاعات نوشته همزمان با عمل نوشتن، برخط نامیده می شود. برای تشخیص دستنوشته برون خط لازم است برای استخراج ویژگی از روش های پردازش تصویر استفاده شود ولی ویژگی های دستنوشته برخط مستقیماً از اطلاعات آن که شامل مختصات افقی و عمودی نقاط نوشته است استخراج می شود. استخراج حروف در زیر-کلمه با قطعه بندی اضافی بر اساس زاویه نوشته با محور افقی انجام شده است و سپس با حذف موارد اشتباه طی چند مرحله، نقاط قطعه بندی نهایی مشخص می شوند. به دلیل وجود نقاط قطعه بندی اضافی، ترکیب های مختلف قطعات امتیازبندی می شوند که این امتیازبندی بر حسب میانگین احتمال نرمالیزه شده رخداد توالی مشاهده قطعات آن ها در مدل مخفی مارکوف است. سپس ترکیب های دارای بالاترین امتیاز به عنوان کاندیدهای نهایی تشخیص گروه حروف معرفی می شوند، با استفاده از فرهنگ لغت متنی، گزینه های با گروه حروف مشابه پیدا می شود و گزینه هایی که در فرهنگ لغت موجود نیستند حذف می شوند. در مرحله بعد گزینه هایی که از نظر وجود علامت در بالا و پایین زیر-کلمه با زیر-کلمه ورودی منطبق نیستند حذف می شوند و در مرحله نهایی گزینه هایی که تعداد حرکت های زیر-کلمه در بالا و پایین آن ها با زیر-کلمه ورودی مساوی نیست حذف می شوند. صحت قطعه بندی با روش این تحقیق با استفاده از ground truth ساخته شده آزمایش شده است که 85/47 درصد نقاط قطعه بندی به درستی شناسایی شده اند و 60/1 درصد نقاط اشتباه پیدا شده است. تشخیص زیر-کلمه با دقت 37/85 درصد انجام شده است که برای 10 گزینه اول بازشناسی به 73/34 درصد می رسد. این مقدار نسبت به کارهایی که با روش کلی نگر که کل زیر-کلمه را به عنوان الگوی شناسایی در نظر می گیرند و روی پایگاه داده تحقیق انجام شده اند خیلی کمتر است که به دلیل ماهیت روش مبتنی بر قطعه بندی است که نیاز به قطعه بندی دقیق دارد اما کار مشابهی با همین پایگاه داده مبتنی بر تشخیص حروف وجود ندارد تا مقایسه انجام شود. مزیت روش مبتنی بر قطعه بندی که در این تحقیق از آن استفاده شده، نسبت به روش کلی نگر در این است که برای شناختن زیر-کلمات جدید کافی است که متن آن ها به سیستم اضافه شود در حالی که روش کلی نگر نیاز به نمونه های جدید دستنوشته دارد. مهم ترین محدودیت این روش، عدم کارایی الگوریتم های قطعه بندی است که خطای آن به مرحله تشخیص منتقل می شود و منجر به کاهش چشمگیر در نرخ شناسایی می شود.
محمد علیپور سراجی علیرضا احمدی فرد
تشخیص خودکار متن یکی از زیر مجموعه های پردازش تصویر است که به طور گسترده در کتابخانه دیجیتال، خواندن آدرس پستی نامه ها، خواندن چک های بانکی، خواندن فرم ها و پرسشنامه ها استفاده می شود. بازشناسی متون دست نوشته فارسی در دو سطح کلی برون خط و بر خط انجام می پذیرد که سیستم های برون خط خود به دو دسته تقسیم می شود: سیستم های مبتنی بر جداسازی و سیستم های کلی نگر. در سیستم های مبتنی بر جداسازی سعی می شود کلمات به زیر کلمات و حروف سازنده آن تقسیم شوند و از آنها برای شناسایی استفاده شود اما در سیستم های کلی نگر، ویژگی ها مستقیما از تصویر کلی کلمه استخراج می شود و با مقایسه با داده های فرهنگ لغت، مشابه ترین کلمه به ورودی به عنوان خروجی در نظر گرفته می شود. در این تحقیق روشی برای بازشناسی کلمات دست نوشته فارسی با استفاده از شکل کلی کلمه ارائه شده است. مراحل کار برای شناسایی کلمه شامل: پیش پردازش(باینری کردن، رفع شکستگی، حذف نویز) ،استخراج ویژگی(گرادیان، پروفایل) و طبقه بند (svm،knn ) است. در مرحله پیش پردازش برای تخمین مکان خط کرسی، تغییراتی در روش هیستوگرام افقی انجام می شود. تشخیص خط کرسی به منظور جداسازی نقاط از بدنه اصلی و هم چنین برای نرمال سازی اجزاء بدنه اصلی ضروری است. در نتیجه فرایند پیشنهادی، از تصویر هر کلمه دو تصویر، یکی تصویر بدنه اصلی و دیگری تصویر نقاط و علائم حاصل می شود. برای استخراج ویژگی های کلمه در تصویر بدنه اصلی، پس از نرمال سازی جداگانه اجزای آن، از بلوک بندی تطبیقی و برای استخراج ویژگی از تصویر نقاط و علائم از بلوک بندی یکنواخت استفاده می کنیم. هر بلوک در تصاویر فوق توسط اندازه گرادیان در 32 جهت توصیف می شود. نتایج حاصل با استفاده از طبقه بندهای k نزدیکترین همسایگی و ماشین بردار پشتیبان نشان دهنده بهبود در دقت بازشناسی روش ارائه شده است اما به علت پیش پردازش های صورت گرفته، روش ارائه شده به زمان بیشتری نسبت به روش های پیشین نیازمند است. با خوشه بندی نمونه ها به منظور کاهش فرهنگ لغت نتیجه بهبود میابد. به منظور خوشه بندی نمونه ها از ویژگی های پروفایل و هیستوگرام افقی و الگوریتم isodata استفاده شده است.
رویا حاتمی حسین خسروی
یکی از موضوعاتی که در دو دهه اخیر مورد توجه بسیاری از پژوهشگران قرار گرفته است، سیستم-های واسط مغز و کامپیوتر (bci) می باشد. سیستم bci سیستمی است که با دریافت سیگنال های مغزی مانند روش الکترو انسفالوگرام (eeg) از افراد، آن ها را به فرمان های کنترلی برای حرکت یک بازو، صندلی چرخدار، یک ربات و سایر وسایل جانبی تبدیل می کند. در bci مبتنی بر تصور حرکتی از افراد خواسته می شود که خود را در حال انجام یک عمل حرکتی ویژه، (بدون خروجی حرکتی) تصور کنند. در نتیجه ی تصور حرکت، رخدادهایی در مغز اتفاق می افتد که بر سیگنالهای eeg تأثیر گذار است. هدف از این پایان نامه طبقه بندی داده های eeg ناشی از چهار تصور حرکتی دست چپ، دست راست، پا و زبان می باشد. مجموعه داده مورد استفاده در این پایان نامه، مجموعه 2a از مسابقه چهارم bci که در سال 2008 برگزار شده است، می باشد. در این پایان نامه دو روش که بر مبنای آنها چهار کلاس تصورحرکتی طبقه بندی می شوند، پیشنهاد شده است. یکی از رو ش های کارآمد در تشخیص تصور حرکتی، روش نگاشت به کمک فیلترهای فضاییcsp می باشد. قبل از اعمال این روش، می بایست سیگنال های مغزی از فیلتر میان گذر مناسبی عبور نموده تا ریتم های مغزی مرتبط با تصور حرکتی ویژه فرد، در روش csp بخوبی استخراج گردد. انتخاب مناسب فیلترهای فرکانسی در کنار فیلترهای فضایی یک چالش مهم در این روش می باشد. در یکی از روش های اخیر به نام ossfn، بهینه سازی فیلترهای فضایی و فرکانسی بر اساس ماکزیمم نمودن اطلاعات متقابل بین بردار ویژگی و برچسب کلاس ها انجام می شود. در روش پیشنهادی اول این پایان نامه، روش ossfn از یک مسئله دو کلاسه به یک مسئله چهارکلاسه تعمیم داده شده است. نتایج نشان می دهد که بهینه سازی همزمان فیلترهای فضایی-فرکانسی دقت طبقه بند را نسبت به روشcsp بطور موثری بالا می برد. در بخش دوٌم این پایان نامه، بجای درنظرگرفتن معیار اطلاعات متقابل بین برچسب کلاس ها و بردارهای ویژگی، معیار ارزیابی کاپا (دقت طبقه بندی) بهینه می گردد. در این روش پیشنهادی نشان می دهیم که با معیار ارزیابی کاپا طبقه بندی چهارکلاس تصورحرکتی کارایی بسیار بهتری دارد. همچنین بجای روش گرادیانی که پیچیدگی نسبتاً بالا و احتمال بدام افتادن در نقاط اپتیمم محلی را دارد، در بهینه سازی، از الگوریتم ژنتیک استفاده نمودیم. نتایج بدست آمده از آزمایش، گواهی بر مزیت روش پیشنهادی بر ossfn دارد. الگوریتم پیشنهادی را gaossfn نامیده ایم.
معصومه اسمعیلی مرتضی زاهدی
در این مطالعه کاربردی، کلاسه بندی پنج تصور ذهنی اندازه گیری شده توسط eeg بررسی و پیاده سازی خواهد شد. سیگنال های eeg در حوزه زمان دارای حجم بالائی هستند، و از این گذشته ممکن است این سیگنال ها حاوی مصنوعاتی باشند که از منابعی غیر از مغز ثبت شده باشند، از قبیل پلک زدن و یا حرکت چشم. بنابراین کاهش اطلاعات زائد و استخراج مفیدترین اطلاعات ضروری به نظر می رسد. در روش پیشنهادی از روش های کاهش ابعاد، یعنی تحلیل مولفه های اصلی (pca) و الگوهای فضائی مشترک (csp) برای حذف اطلاعات زائد استفاده می شود. اما باز هم قسمت هائی از سیگنال شامل مصنوعاتی است که با این روش ها قابل حذف نیستند. برای همین ابتدا سیگنال ها را پنجره کرده و سپس بر روی هر پنجره به صورت مجزا روش های استخراج ویژگی pca یا csp را اعمال می کنیم. سپس ویژگی های استخراج شده از پنجره های آلوده را از بردار ویژگی نهائی حذف می کنیم. اما به دلیل اینکه مصنوعات در مولفه های زمانی سیگنال واضح نیستند، نمی توان به صورت دقیق پنجره های آلوده را تشخیص داد. بنابراین می توان با استفاده از الگوریتم های بهینه سازی جستجو از قبیل الگوریتم ژنتیک (ga) و الگوریتم بهینه سازی ذرات (pso)، و همچنین روش انتخاب ویژگی رو به جلو ، راه حل های حاوی بهترین پنجره ها را جستجو کرد. اما مسئله ای که وجود دارد این است که پنجره هائی که حذف می شوند، ممکن است شامل ویژگی های مفید نیز باشند. زیرا در پنجره بندی با ابعاد ثابت، مرز مصنوعات به صورت دقیق مشخص نمی شود. راه حل این است که این الگوریتم را در چند مرحله بر روی پنجره های با ابعاد متفاوت آزمایش کنیم و در نهایت بهترین ابعاد را انتخاب کنیم. الگوریتم پیشنهادی را بر روی یک مجموعه داده حاوی پنج کار ذهنی ثبت شده در دانشگاه کلرادو، اعمال کردیم. با به کار بردن روش پیشنهادی بر روی سیگنال های حاوی 50 پنجره ، با تقسیم 70 به 30 برای مرحله آموزش و تست، توانستیم به نرخ موفقیت 100درصد دست پیدا کنیم.
زهرا ایمانی علیرضا احمدی فرد
در این پایان نامه سیستمی برای بازشناسی برون خط کلمات دستنویس فارسی ارائه شده است. پیچیدگی نگارش فارسی و شکل متفاوت حروف بسته به موقعیت آن که اول کلمه، وسط کلمه، انتهای کلمه یا جدا از بخش های دیگر کلمه باشد بازشناسی کلمات در این زبان را بسیار دشوار نموده است. بطوریکه درصد بازشناسی روش های موجود کمتر از نرخ مطلوب برای تجاری شدن این سیستمها می باشد. یک سیستم بازشناسی کلمه در حالت کلی شامل مراحل پیشپردازش، استخراج ویژگی و کلاسهبندی است. در این پایان نامه سه روش جهت بازشناسی پیشنهاد شده و کارایی این روش ها در مقایسه با روش های موجود ارزیابی شده است. به دلیل نبود یک پایگاه داده مناسب و با تعداد تصویر کافی برای ارزیابی کارایی سیستم پیشنهادی، پایگاه داده فارسا، شامل 30000 تصویر از 300 کلمه متداول دست نوشته در زبان فارسی، ایجاد شد. جهت ارزیابی روش های پیشنهادی و مقایسه با روش های موجود 198 کلاس از این پایگاه داده مورد استفاده قرار گرفت. در روش اول تصویر کلمه به پنجرههای عمودی دارای همپوشانی تقسیم میشود و از هر پنجره هیستوگرام کدهای زنجیرهای استخراج میشود، هر پنجره یک بردار 20 عنصری را تولید مینماید. برای آموزش و ارزیابی hmm گسسته بردار ویژگیهای استخراج شده از پنجره لغزان، با استفاده از شبکه عصبی نگاشت خودسازمانده کوانتیزه میشود . برای تعداد حالتهای مخفی مدل hmmدر هر کلاس کلمه ، کمترین تعداد پنجره برای تصاویر آموزش در هر کلاس بدست میآید. تعداد حالتهای مخفی ضریبی از این مقدار کمینه است. با آزمایش ضرایب مختلف، سیستم در مقدار 8/1 به بهترین نرخ بازشناسی میرسد. برای پارامتر هموارسازی روی مقادیر مختلف آزمایش شد، سیستم در مقدار 001/0 به جواب بهتری رسید. اندازه کتاب رمز 49 تنظیم میشود. در نهایت روش پیشنهادی اول با تعیین ضرایب بیان شده در بالا به نرخ بازشناسی 57/66% در198 کلاس از پایگاه داده فارسا میرسد. در روش پیشنهادی دوم علاوه بر هیستوگرام کدهای زنجیرهای، از ویژگی میانگین بلوکی برای کلاسهبندی استفاده میشود و ابعاد بردارهای ویژگی به 25 افزایش مییابد. نرخ بازشناسی با استفاده از همان ضرایب تنظیم شده در روش اول، 88/68% بدست میآید. که افزایش بیش از 2% را نسبت به روش اول نشان میدهد. روش پیشنهادی سوم در واقع بکارگیری یک سیستم دو خبرهای است. با استفاده از بررسی که روی نتایج ارزیابی روش دوم انجام شد یک مفهوم جدید به نام معیار اطمینان برای کلاسهبند hmm معرفی میشود. با مشاهده هیستوگرام اختلاف دو بزرگترین احتمال در خروجی hmm برای تصاویر آزمون یک مقدار آستانه به عنوان معیار اطمینان معرفی میشود. تصاویری که شرایط معیار اطمینان را دارند با کلاسهبند hmm بازشناسی میشوند و تصاویری که این شرایط را ندارند با استفاده از کلاسهبند knn بازشناسی میشوند. برای کلاسهبند knnاز ویژگیهای ساختاری ، تعداد مولفههای متصل تصویر، تعداد مولفههای متصل بالای خط کرسی و تعداد مولفههای متصل پایین خط کرسی، استفاده میشود. کلاسهبند knn با استفاده از این ویژگیها و با 11 نزدیکترین همسایه و معیار فاصله بلوک شهری به نرخ بازشناسی 69/61% دست مییابد. در این سیستم hmm برای تصاویری که معیار اطمینان را دارند به نرخ بازشناسی 85% دست مییابد. در کل نرخ بازشناسی این روش برای 198 کلاس از پایگاه داده فارسا 49/76% است. که نسبت به روش اول افزایش 7% را بدنبال دارد.
جمال جمال اوغلی مرتضی زاهدی
امروزه یکی از ملزومات ارتقاء کیفیت و کمیت محصولات صنعتی، استفاده از ماشین آلاتی است که کارکردشان به طور خودکار بوده و اتکای آن به عوامل انسانی کمتر باشد. علی رغم پیشرفت های صورت گرفته در اتوماسیون صنعت کاشی و سرامیک، عیب یابی این محصولات به منظور درجه بندی یا خارج کردن محصولات فاقد کیفیت در روند تولید، هنوز بصورت دستی بوده و توسط عوامل انسانی انجام می گیرد. اغلب کارهای انجام شده در این زمینه روی عیوبی متمرکز شده اند که وجودشان نمی تواند بطور یقین سرنوشت محصول را در مرحله ای از تولید تعیین کند. اهمیت عیوب شکستگی از آنجاست که اگر محصولی دارای این عیوب باشد، به احتمال بسیاری بازیافت شده و در صورت تشخیص بموقع این عیوب، از ارسال محصول به مراحل بعدی می تواند جلوگیری شود. که این امر باعث کاهش هزینه های تولید و اثرات نامطلوب زیست محیطی می شود. موارد ذکر شده امکان بررسی جداگانه این عیوب را فراهم میکند. از این رو در این پایان نامه ضمن مطالعه و بررسی روشها و چالش های موجود در زمینه ی مربوط و با استفاده از دانش پردازش تصویر و بینایی ماشین، سعی در ارائه ی روشی ساده برای آشکارسازی خودکار عیوب شکستگی و پریدگی در مرزها و بدنه ی کاشی و سرامیک شده است. روش پیشنهادی با استفاده از دیدگاه بازیابی مرزهای سالم و آشکارسازی حفره ها، اقدام به شناسایی عیوب می کند. با استفاده از دیدگاه روش پیشنهادی این پایان نامه، کشف، شمارش، نمایش و درجه بندی عیوب شکستگی بصورت بلادرنگ و با دقتی بالا انجام خواهد شد. علاوه بر این، تدابیری در ارائه ی روش پیشنهادی در نظر گرفته شده است، که امکان استفاده از روش را در دو فاز مختلف تولید فراهم می کند. بطوریکه اولین مرحله استفاده از روش پیشنهادی، قبل از ورود محصولات به کوره میباشد. جایی که بدنه کاشی هنوز موادی ضعیف میباشد. آمارها نشان میدهد که شایع ترین محل وقوع این عیوب نزدیکی این مرحله میباشد. که در اینصورت روش پیشنهادی قادر خواهد بود با شناسایی کاشی بازیافتی، عدم کیفیت آنرا اعلام کرده و از ارسال محصول به مراحل بعد و در نهایت از تحمیل هزینه های زائد جلوگیری کند. کاربرد دوم استفاده از روش در مرحله ی درجه بندی محصولات میباشد. از این رو قابلیت درجه بندی محصولات با توجه به اندازه ی عیوب و تعدادشان، به سایر قابلیت های روش پیشنهادی افزوده شده است. بنابراین بدیهی است که روش مذکور نسبت به لعاب محصولات سرامیک مستقل باشد. از برجسته ترین ویژگی های روش مذکور، بلادرنگ بودن زمان اجرای روش می باشد. که این امر در صنعت بسیار حائز اهمیت است.
بهزاد سرشاد حسین خسروی
آشکارسازی عیوب سطحی از طریق روش های تحلیل بافت که توصیف کننده ویژگی سطوح هستند، امکان پذیر است. برای این منظور تبدیل کانتورلت را جهت آنالیز تصاویر کاشی بکار برده ایم، کانتورلت یک تبدیل دو بعدی جهت دار است که برای توصیف منحنی ها و جزئیات ظریف در تصاویر به کار می رود. بسط کانتورلت از توابع پایه ای که در جهات مختلف، با اشکال و مقیاس های مختلف گرایش دارند(ناهمسانگردی)، تشکیل شده است. در ادامه از شبکه عصبی برای آموزش داده ها و یافتن کاشی های معیوب استفاده کرده ایم. نتایج حاصل بسیار مطلوب با تشخیص عیب بالای 96.87% است که در مقایسه با کارهای صورت گرفته برتری قابل توجهی دارد.
حامد عرب یارمحمدی علیرضا احمدی فرد
برای بازشناسی زیرکلمات فارسی سه رویکرد مبتنی بر جداسازی به حروف، مبتنی بر شکل کلی زیرکلمه و ترکیبی از این دو وجود دارد. در بسیاری از سازمان ها، تصاویر نامه ها با درجـه تفکـیک 150 نقطه بر اینچ و کمتر ذخیره می شوند. متنی با این درجه تفکـیک برای خواندن توسط کاربر انسانی مناسب است اما برای بازشناسی توسط سیستم شناسایی نوری کلمات این درجه تفکیک بسیار کم به نظر می رسد. حتی سیستم های شناسایی نوری کلمات لاتین هم غالبا برای 300 نقطه بر اینچ، توسعه یافته اند. در درجـه ی تفکـیک پایین ، جـداسازی به سخـتی امکان پذیر است و باید از روش هایی مانند شکل کلی استفاده نمود. در این پایان نامه به بررسی و بازشناسی زیرکلمات فارسی با درجـه تفکـیک 96 نقطه بر اینچ می پردازیم که برای این منظور از شکل کلی زیرکلمات برای بازشناسی آنها بهره برده ایم. سیستمی که در اینجا برای بازشناسی زیرکلمات فارسی ارائه شده مبتنی بر یک روش سه مرحله ای است . در مرحله نخست به کمک خوشه بندی، دامنه ی جستجوی تصاویر زیرکلمات موجود در فرهنگ لغت کاهش داده شده که این کار نه تنـها سرعت سیستم را بالا می برد بلکه دقت را نیز افزایش می دهد، در مرحله دوم بازشناسی، با استفاده از یک طبقه بند، 4 خوشه ی نزدیک به زیرکلمه ی آزمون ورودی تشخیص داده می شود و پس از آن با جستجو در میان آن خوشه های هدف، 10 نزدیک ترین زیرکلمات موجود در فرهنگ لغت، به زیرکلمه ی آزمون را می یابیم، این روند برای تمام زیرکلمات یک کلمه تکرار شده سپس در مرحله ی سوم با استفاده از روش رخدادهای محتمل برای توالی زیرکلمات، کلمه ی آزمون تشخیص داده می شود. دقت این الگوریتم بازشناسی بسیار مناسب تخمین زده می شود و قابلیت بازشناسی 098/01 % در کلماتی که از بیش از یک زیرکلمه تشکیل شده اند را داراست و کلماتی که صرفاً، تک زیرکلمه ای اند را با دقت 82/53 % بازشناسی می کند.
راضیه معصومی علیرضا احمدی فرد
با پیشرفت سریع فناوری محاسبات و صنعت رایانه ع?قه محققان به طراحی و توسعه دستگاه های تشخیص خودکار برای بهبود خدمات پزشکی افزایش یافته است. دو ویژگی اصلی این گونه دستگاه ها قابلیت اطمینان با? و دقت زیاد آنهاست.. بدلیل مشکلات متعدد در تصاویر شبکیه ی چشم استخراج عروق از این تصاویر دشوار می باشد. محققان این نقاط ضعف را مورد بررسی قرار داده با الگوریتم های پیشنهادی تلاش در بهبود روش های استخراج عروق نموده اند. آنچه در این تحقیق مورد توجه قرار گرفته است، جداسازی رگ های شبکیه ی چشم از تصاویر مربوط به آن است. اگر به این تصاویر به صورت یک رویه در فضای 3 بعدی نگاه کنیم به طوری که بعد سوم میزان روشنایی تصویر را نشان می دهد ، متوجه می شویم که رگ ها به شکل رویه های ناودانی با مقطع گوسی با ارتفاع و عرض های متفاوت هستند. با استفاده از این مدل الگوریتمی برای استخراج عروق پیشنهاد نموده ایم. الگوریتم پیشنهاد شده در این تحقیق شامل 3 بخش اساسی است. بخش اول مربوط به حذف نویزو عدم یکنواختی روشنایی در تصاویر شبکیه است که مرحله ی پیش پردازش نام دارد. این مرحله خود شامل سه بخش است که در بخش اول تبدیل کانتورلت غیر زیر نمونه بردار را به تصویر اعمال کرده و در بخش دوم ضرایب آن توسط الگوریتم پرندگان (pso) اصلاح می شود؛ بخش نهایی باز سازی تصویر بهبود یافته با استفاده از ضرایب اصلاح شده می باشد. در این بخش تصویر بدست آمده وارد مرحله ی دوم می شود؛ در این مرحله، از روش آشکار ساز خطی در مقیاس ها و جهت های متفاوت استفاده کرده ایم. از نتایج این بخش ویژگی هایی مربوط به رگ ها جهت استخراج آنها بدست آورده ایم. با استفاده از ویژگی های بدست آمده و قرار دادن آستانه ای مناسب برای هرکدام به طور جداگانه، رگ ها همراه با کمی نویز استخراج می شوند. به منظور ارتقاء کیفیت رگ های استخراج شده یک مرحله ی پس پردازش نیز روی تصویر اعمال شده است. در این پژوهش از پایگاه داده ی drive استفاده شد. الگوریتم پیشنهادی بر روی 20 تصویر مجموعه ی test این پایگاده داده اعمال شد. میانگین نتایج بدست آمده برای سه تابع ارزیابی acc، tprو fpr به ترتیب برابر است با 0.9401، 0.6815 و 0.0218 همچنین برای نمایش بهتر نتایج، مقایسه ای بین نتایج بدست آمده توسط الگوریتم پیشنهادی و چندین الگوریتم دیگر صورت گرفته است.
عباس زهره وند علیرضا احمدی فرد
در این پایان¬نامه روشی برای بازشناسی و مکان¬یابی اشیا در صحنه¬های پیچیده(شلوغ) ارائه شد. یکی از مهمترین و ابتدایی ترین مراحل در بینایی ماشین ، بازشناسی اشیا می¬باشد. اگر این فرآیند به درستی و با قابلیت اطمینان انجام نشود مراحل بعدی به درستی صورت نمی¬گیرد. روش پیشنهاد شده در نهایت ترکیبی از دو روش موجود می¬باشد. هر دو روش موجود از یک فرآیند آرام¬سازی احتمالاتی برای تطبیق استفاده می¬کنند. این دو روش ابتدا با استفاده از توصیفگر sift نقاط کلیدی را برای صحنه و مدل بدست آورده و سپس با استفاده از تعریف همسایگی، از نقاط بدست آمده یک گراف می¬سازند. هر نود در گراف ساخته یکی از همان نقاط کلیدی است. این گراف سپس با استفاده از دو ویژگی توصیف می¬شود. ویژگی یکانی که برای توصیف هر نود به تنهایی استفاده شده و همان بردار 128 تاییsift می¬باشد. ویژگی باینری برای توصیف همسایگی دو نود استفاده می¬شود. برای ویژگی باینری از ویژگی-های مقیاس و جهت استخراج شده توسطsift استفاده می¬شود. برای بررسی تحمل دو روش تطبیق از یک سو و همچنین تعیین دقیق پارامترهای مسئله تطبیق، یک محیط شبیه سازی ساخته شد. در ادامه اتفاقات متداول دنیای واقعی در این محیط شبیه سازی شد. سپس تحمل دو روش تطبیق در این محیط شبیه سازی مورد ارزیابی قرار گرفت. حاصل این ارزیابی نشان¬داد که روش اول با استراتژی نود ساختگی پوچ عملکرد بهتری نسبت به روش دوم داشت. از طرفی وقتی نویز به صحنه وارد می¬شد روش دوم عملکردی بهتری داشت. هردو روش زمانیکه قدرت نویز از یک آستانه فراتر می¬رفت دچار یک آشوب می¬شوند لذا نرخ بازشناسی خوبی بالایی نداشتند. در این حالت روش اول از آنجا که به دلیل وجود نویز هیچ مشاهده قابل اعتمادی وجود نداشت تمامی نودها را به سمت نود پوچ میل می¬داد. در نهایت چندین سناریوی واقعی ترتیب داده شد و دو روش تطبیق در این سناریوها مورد ارزیابی قرار گرفت. همانظور که انتظار می¬رفت روش اول قابلت اطمینان(منظور از قابلیت اطمینان تعداد تطبیق¬های اشتباه کمتر می¬باشد) بیشتری نسبت به روش اول داشت. اما روش دوم تعداد تطبیق¬های درست بیشتری را پیدا می¬کرد. برای استفاده از ویژگی¬های مناسب دو روش، یعنی قابلیت اطمینان بالا در کنار نرخ بازشناسی بالا ترکیب دو روش پیشنهاد شد. روش پیشنهادی نه تنها قابلیت اطمینان بالاتری نسبت به دو روش اول و دوم داشت، بلکه نسبت به هردو روش نرخ باز شناسی بالاتری داشت.
امین صاحبی علی سلیمانی ایوری
در این پایان نامه، شبیه سازی و پیاده سازی مرحله ی آزمایش ماشین بردار پشتیبان موازی (psvm) را ارائه می دهیم. مرحله ی آموزش به صورت جدا و از پیش توسط نرم افزار matlab صورت گرفته است و از نتایج آن در مرحله ی آزمایش استفاده گردیده است. در این پایان نامه از قطعه fpga ساخت شرکت xilinx به نام spartan3e استفاده شده که از طبقه ی fpga های ارزان قیمت و دارای منابع محدود می باشد. به دلیل وجود منابع محدود در این قطعه از کرنل سخت افزار پسند استفاده شده است که با توجه به عدم نیاز آن به ضرب کننده ها باعث صرفه جویی در مصرف منابع می گردد. برای اجرای الگوریتم ماشین بردار پشتیبان موازی (psvm) در معماری برخی بلوک های محاسباتی تغییراتی را ایجاد کرده ایم و نشان داده ایم که با پیاده سازی معماری پیشنهاد شده علی رغم کمی پیچیده تر شدن الگوریتم، تغییر محسوسی در عملکرد کلی سیستم از لحاظ سرعت انجام محاسبات، نسبت به سایر مراجع را شاهد خواهیم بود. ماشین بردار پشتیبان موازی با سرعت کلاک کمتر از 100mhz و با مصرف بخش بسیار کوچکی از منابع، بدون استفاده ی محسوس از ضرب کننده ها و تنها حدود 2% از منابع میکروپروسسور، نسبت به سایر مراجع ذکر شده بسیار سریعتر بوده و می تواند تعداد بسیار بیشتری فرایند را بصورت موازی در زمان بسیار کمتری انجام دهد.
عبدالمجید دژم خوی علی دستفان
امروزه مسائل کیفیت توان، از جمله فلیکر، از دغدغه¬های عمده¬ی شرکت¬های برق و مصرف کنندگان می¬باشد. مهم¬ترین گام در راستای کاهش اثر فلیکر و انجام امور اصلاحی تشخیص محل اتصال منابع فلیکر به خصوص در شبکه¬های غیرشعاعی است. در این پایان¬نامه روش¬هایی برای تشخیص محل اتصال منبع فلیکر، تفکیک سهم منابع فلیکر در نوسان دامنه هر کدام از باس¬ها و پیش¬بینی نوسان دامنه ناایستان ارائه می¬شود. برای وضعیتی که منابع فلیکر با فرکانس¬های متفاوتی نوسان می¬کنند، روشی بر اساس طراحی فیلتر همبسته جهت تفکیک تُن¬های فلیکری در ولتاژ هر باس پیشنهاد شده است. در این روش با توجه به اندازه دامنه تُن¬ها، محل اتصال هر کدام از منابع تشخیص داده می¬شود. برای وضعیتی که منابع فلیکر به صورت هم فرکانس نوسان می¬کنند، دو روش اساسی در پیش گرفته می¬شود. در روش اول که از داده¬های آموزشی استفاده می¬شود از دو ابزار خوشه¬بندی میانگین k و ضریب همبستگی آماری استفاده می¬شود. در روش دوم یا روش تحلیلی با در نظر گرفتن منابع فلیکر به عنوان متغیرها و جریان¬ها و ولتاژها به عنوان توابع چند متغیره پس از تشکیل ماتریس ژاکوبین ملاکی برای تشخیص تک نقطه¬ای منابع فلیکر ارائه می¬شود. همچنین پس از تحلیل تئوریک علت غالب شدن یک منبع فلیکر، از گراف جهت¬دار برای نمایش نحوه انتشار فلیکر در شبکه و تشخیص محل منبع فلیکر غالب استفاده می¬شود. برای شرایطی که نوسان دامنه به صورت ناایستان باشد، با در نظر گرفتن سیگنال پوش گسسته به عنوان سری زمانی، شاخصی برای شدت نوسان معرفی می¬شود. همچنین پوش ناایستان توسط روش¬های سری زمانی و مدل¬های خاکستری اصلاح شده پیش¬بینی می¬گردد. شبیه¬سازی¬های انجام شده توانایی روش¬های پیشنهادی برای اهداف مورد نظر را نشان می¬دهند.
فاطمه همتی حسین مروی
جستجوی اطلاعات بر اساس صوت، تصویر و یا ویدئو هستند. براین اساس و با توجه به حجم بالای اطلاعات موجود، روش های تحلیل و دسته بندی اتوماتیک صوتی از اهمیت خاصی برخوردار است. وابستگی آن به متغیرهای کیفی انسان بر پیچیدگی کار می افزاید. در این پایان نامه سعی شده است با آنالیز صوت، روشی برای تشخیص استرس از روی پارامترهای مبتنی بر ضرایب کپسترال دینامیکی بیان شود. تغییر مشخصات گویندگان، تغییرات فرهنگی، زبان و تعریف استرس به صورت دقیق و... از جمله مواردی هستند که بر پیچیدگی کار می افزایند. با توجه به عدم دسترسی به پایگاه داده فارسی برای تشخیص استرس ابتدا یک پایگاه داده مناسب آماده شده که سعی کردیم پارامترهای موجود در پایگاه داده-های استاندارد در آن لحاظ شود. سپس براساس ویژگی های صرفا مبتنی بر ضرایب کپسترال، استرس دار یا بدون استرس بودن گفتار مشخص شده است. بدیهی است بدلیل اینکه روش فقط بر پایه ضرایب کپسترال دینامیک می باشد، هنگام ارزیابی درصد صحت آن بخوبی روش های ترکیبی یا پارامتری نخواهد بود. با این حال نتایج بدست آمده نشان داد استرس موجود در گفتار، مستقل از فرهنگ و قومیت بر ضرایب کپسترال تأثیرمعنی داری می گذارد ولذا در اکثر موارد از روی ویژگی های استخراجی از ضرایب کپسترال می توان استرس را تا حد قابل قبولی تشخیص داد و ما با استفاده از این ویژگی ها به درصد تشخیص خوبی برای تشخیص استرس رسیدیم.
معصومه دهقان علیرضا احمدی فرد
در این پایان نامه، روشی برای تشخیص زود هنگام سرطان سینه بر اساس آنالیز آماری بافت و ویژگی های حوزه فرکانس به کمک تصاویر ماموگرافی ارائه شده است. برای این منظور از ضرایب تبدیل موجک به عنوان ویژگی های حوزه فرکانس و آمارگان ماتریس هم رخداد به عنوان ویژگی های آماری بافت استفاده می کنیم. با توجه به حجم بالای ویژگی های استخراج شده از تصویر بافت سینه ، اقدام به انتخاب ویژگی می نماییم. برای این منظور ویژگی هایی را انتخاب می نماییم که استقلال بیشتری نسبت به هم داشته باشند. برای آموزش یک طبقه بند جهت جدا سازی بافت های سالم از میکروکلسیفیکیشن که نشانه اولیه برای سرطان سینه می باشد، ویژگی های اشاره شده از مجموعه آموزشی استخراج می شود. برای این منظور از طبقه بندهای svm و adaboost استفاده نموده ایم، که نتایج تجربی نشان داد که طبقه بند svm با هسته ی rbf بهتر می تواند بافت های سالم و نا سالم را جدا سازی نماید. برای از بین بردن شرایط تصادفی آموزش و آزمایش در مرحله طبقه بندی، از روش 10-fold cross validation استفاده شد تا معیار های ارزیابی طبقه بند از اعتبار کافی برخوردار باشند. برای ارزیابی روش پیشنهادی از پایگاه داده ddsm استفاده شد در این پایگاه داده تصاویر ماموگرافی هر بیمار از زوایای مختلف در دسترس است. هر تصویر توسط متخصص آنالیز شده و در مواردی که رسوب های کلسیمی (میکروکلسیفیکیشن) رویت شده است، منطقه مربوطه توسط متخصص مشخص شده است. با روش انتخاب ویژگی ترتیبی تعداد ویژگی مناسب برای طبقه بندی 13 ویژگی بدست آمد که درصد درستی در تشخیص بافت های سرطانی با طبقه بند svm و هسته ی rbf ، 90% بدست آمد.
فاطمه اعظم پور علیرضا احمدی فرد
گسل ها، گنبد های نمکی و کانال های مدفون از جمله مهم ترین رویدادهای ساختمانی می باشند که شناخت و تعیین محل دقیق آن ها در داده های لرزه ای یک عامل مهم در توصیف مخازن هیدروکربن است. اما این رویدادها اغلب دارای بازتاب های ضعیفی در داده های لرزه ای بازتابی هستند و به ندرت قابل شناسایی و تفسیر می باشند. نشانگرهای لرزه ای، ابزاری هستند که اطلاعات نهفته در داده های لرزه ای را آشکار می نمایند. در این پایان نامه از نشانگر لرزه ای بر مبنای فیلتر سوبل برای شناسایی این رویدادها در داده های لرزه ای بازتابی استفاده می شود. فیلتر سوبل به طور معمول جهت تشخیص لبه در مباحث پردازش تصویر استفاده می شود. این فیلتر به تغییرات دامنه حساس می باشد و از تقریب مشتق برای یافتن لبه ها استفاده می کند و نقاطی را که گرادیان در آن ها حداکثر است به عنوان لبه در نظر می گیرد. در نتیجه مرزها و ناپیوستگی ها را به عنوان نواحی با دامنه بالا برجسته می کند. برای بهبود نتایج تشخیص لبه در داده های لرزه ای، عملگرهای سوبل در ابعاد مختلف را می توان در راستای شیب رویدادهای بازتابی اعمال نمود. محاسبه تغییرات شیب در یک داده لرزه ای می تواند نتایج را در شناسایی مرزها بهبود دهد. بنابراین در روش مورد استفاده قبل از محاسبه سوبل، شیب ساختاری با استفاده از یافتن بیشینه همبستگی دو ردلرزه مجاور در یک پنجره محلی تخمین زده می شود. در نتیجه مقادیر دامنه از داده لرزه ای به موازات شیب استخراج می شوند و در نتیجه گسل ها و مرزها در امتداد شیب شناسایی می گردند. روش جدیدی که در این پایان نامه در شناسایی مرزهای گنبد نمکی مورد استفاده قرار گرفته است، استفاده از روش متوازن سازی بر پایه تبدیل هیلبرت می باشد. متوازن سازی به نمایش بهتر مرزها به خصوص مرزهای ناشی از تغییرات کم دامنه کمک زیادی می نماید. در این پایان نامه نشانگر لرزه ای سوبل در حالت متداول و متوازن و با احتساب شیب بر روی مقاطع لرزه ای مصنوعی و واقعی اعمال شده است. نتایج به دست آمده عملکرد مناسب روش را برای شناسایی رویدادهای لرزه ای بازتابی نشان می دهد.
محمدامین طلوع بیدختی علیرضا احمدی فرد
تصاویر سند تهیه شده توسط اسکنر یا دوربین دیجیتال، همواره با دو نوع اعوجاج فتومتریک و اعوجاج هندسی همراه هستند. هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم افزارهای ocr می شوند. در این پایان نامه سعی بر این است که با ارائه ی روشی نوین و همچنین بهبود روش های گذشته، به رفع اعوجاج اسناد به منظور بهبود عملکرد نرم افزارهای ocr دست یابیم. در این پایان نامه به منظور تصحیح اعوجاج فتومتریک از روش درون نگاری هارمونیک استفاده شده است. به منظور افزایش دقّت این الگوریتم پیشنهاد نموده ایم تا از همسایه های قطری هر پیکسل نیز استفاده شود؛ این عمل موجب بهبود تخمین روشنایی پس زمینه می گردد. همچنین برای کاهش پیچیدگی محاسباتی پیشنهاد نمودیم تا در اجرای الگوریتم درون نگاری یک بار از همسایه های چهارتایی اصلی و بار دیگر از همسایه های قطری استفاده نماییم. با این روش پیچیدگی محاسباتی روش پیشنهادی نیز افزایش نمی یابد. علاوه بر این به منظور بهبود کیفیت درتخمین پس زمینه از فیلترهای ملایم کننده ی گوسی و میانگین گیر نیز استفاده شده است. همچنین به منظور تصحیح اعوجاج هندسی پس از استخراج خطوط از تصویر، هر خط به چندین نوار عمودی تقسیم می شود. در هر نوار مختصات نقطه ای که مقدار افکنش افقی آن بیشینه است؛ ذخیره می شود. انحنای هر خط به کمک این مجموعه نقاط توسط تابع درجه ی سوم مشخص می گردد. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف می گردد. درضمن به منظور تشخیص انحنای خطوط با طول کم از انحنای خطوط با طول بزرگ تر خط قبلی یا بعدی استفاده می شود. روش های پیشنهادی بر روی پایگاه های داده ی فارسی و انگلیسی پیاده سازی شده و با روش های دیگر مقایسه گردیده است. نتایج بیانگر قدرت و دقّت روش پیشنهادی در رفع این دو نوع اعوجاج است.
علی حریمی علیرضا احمدی فرد
تشخیص احساس از روی گفتار موضوعی میان رشته ای در حوزه ی روانشناسی، بازشناسی الگو و پردازش سیگنال می باشد که در دهه ی اخیر توجه بسیاری از پژوهشگران را به خود جلب نموده است. در این رساله با آنالیز تصویر طیف نگاره ی گفتار ویژگی های مبتنی بر الگوهای طیفی و انرژی هارمونیک ها را استخراج نمودیم. ویژگی های دینامیکی غیر خطی نیز با استفاده از بازسازی فضای فاز سه بعدی سیگنال گفتار استخراج شدند. سپس، از معیار فیشر برای فیلتر کردن ویژگی های نویزی استفاده گردید. الگوریتم های انتخاب متوالی رو به جلو و الگوریتم ژنتیک نیز بعنوان یک مرحله مکمل، برای انتخاب بردار ویژگی بهینه بکار گرفته شدند. به منظور طبقه بندی احساس های گسسته و پیوسته در پایگاه داده ی برلین و vam از طبقه بند و رگرسیون مبتنی بر ماشین بردارهای پشتیبان استفاده شده است. بر اساس نتایج آزمایش ها، ویژگی های دینامیکی غیرخطی در کاهش تداخل احساس های خشم و خوشحالی و به تبع آن در افزایش نرخ بازشناسی بسیار موثر می باشند. با استفاده از ویژگی های متداول عروضی و طیفی، بهترین نرخ تشخیص بدست آمده برای طبقه بندی احساس های خشم و خوشحالی برای زنان 78/83% و برای مردان 95/91% می باشد. با استفاده از ویژگی های دینامیکی غیرخطی این مقادیر بترتیب به 1/99% و 85/98% افزایش می یابند. برای طبقه بندی 7 احساس اولیه نیز بالاترین نرخ تشخیص بدست آمده با استفاده از سیستم پیشنهادی 34/92% (35/96% برای زنان و 18/87% برای مردان) می باشد. در بازشناسی احساس های پیوسته نیز با استفاده از ویژگی های متداول عروضی و طیفی بالاترین ضریب همبستگی برانگیختگی، جاذبه و سلطه بترتیب 99/83% و 53% و 4/83% بدست آمدند. با افزودن ویژگی های دینامیکی غیرخطی به این ویژگی ها، ضریب همبستگی برای برانگیختگی، جاذبه و سلطه بترتیب 06/85% و 39/53% و 68/84% محاسبه گردید.
جواد جوکار حسین مروی
در این پایان نامه مسأله شناسایی اشیاء از پیش تعیین شده در یک تصویر از صحنه، مورد مطالعه قرار می گیرد. این مسأله کاربرد فراوانی در بینایی ربات دارد. از آنجا که برای یک ربات مسأله بلادرنگ بودن الگوریتم یک امر مهم است، روش ارائه شده باید دارای سرعت خوبی بوده و همچنین دقت آن هم مناسب باشد. با بررسی روش های موجود از توصیفگر surf برای بازنمایی تصویر شیء استفاده شد. این روش هم دقت خوب و هم سرعت مناسبی دارد. برای انطباق توصیفگرهای استخراج شده فاصله اقلیدسی بین زوج توصیفگرهای صحنه و مدل اشیاء محاسبه می گردد. این روش به دلیل پیچیدگی محاسباتی کم پیشنهاد گردید. در مرحله تطبیق یک سری داده های پرت بوجود می آیند که برای حذف آن ها از روش ransac استفاده شده است. همچنین برای پیاده سازی الگوریتم روی ربات باید از یک سخت افزار استفاده کنیم که قابل حمل بوده و همچنین سرعت اجرای مناسبی داشته باشد. به همین منظور ما از پردازنده ِی dsp شرکت ti سری داوینچی مدل dm6446 بهره برده ایم. ما در این پایان نامه الگوریتم پیشنهادی را بر روی سخت افزار اشاره شده پیاده سازی نمودیم.
علی صیادی علیرضا احمدی فرد
یکی از روش¬های شناخت ساختارهای زیرسطحی زمین، استفاده از روش های ژئوفیزیکی به-خصوص لرزه نگاری بازتابی است. گنبد¬های نمکی یکی از ساختارهای زیرسطحی هستند که به¬عنوان یکی از مهم¬ترین تله¬های هیدروکربنی و یکی از مهم ترین عوارض طبیعی زمین شناسی برای ذخیره-سازی هیدروکربن¬ها به شمار می¬روند. این ساختارها برای ایزوله کردن زباله های هسته ای، معدنکاری انحلال، ایجاد فضا برای سازه های زیرزمینی و ایجاد مخزن هوای فشرده نیز ارزشمند هستند. نشانگرهای لرزه¬ای، ابزاری بسیار کارآمد در زمینه تفسیر لرزه¬ای و مشخص کردن هر چه بهتر و آسان¬تر ویژگی¬های زمین¬شناسی هستند که اطلاعات پنهان در داده¬های لرزه¬ای بازتابی را آشکار می سازند. دسته مهمی از نشانگرهای لرزه¬ای که در شناسایی گنبدهای نمکی نیز کاربرد دارند، نشانگرهای بافتی مبتنی بر ماتریس هم¬رخداد سطح خاکستری هستند. ماتریس هم¬رخداد سطح خاکستری، یک ابزار قدرتمند در زمینه پردازش تصویر است که به استخراج خواص بافتی یک تصویر می پردازد. در نشانگرهای بافتی مبتنی بر ماتریس هم¬رخداد، مقطع لرزه ای به¬عنوان یک تصویر در نظر گرفته می¬شود و مشخصه های بافتی آن استخراج می شود. با توجه به تفاوت بافتی گنبد نمکی با ساختارهای پیرامونش، این نشانگرها می توانند آن را از سایر ساختارهای دربرگیرنده متمایز سازند. محاسبات ماتریس هم¬رخداد در راستای شیب ساختاری، عملکرد نشانگرهای استخراجی از ماتریس هم¬رخداد را بسیار بهبود می¬بخشد. در این پایان¬نامه، شیب ساختارهای زیرسطحی زمین در محاسبه این نشانگرها لحاظ شده است. نتایج نشان می¬دهد که با به¬کارگیری شیب ساختارها، مرزهای جانبی گنبد نمکی با دقت بیشتری قابل تعیین هستند. اغلب نشانگرهای لرزه¬ای در شناسایی کف گنبد نمکی ناتوان هستند و به این دلیل، شناسایی کف گنبد نمکی یکی از بزرگ-ترین چالش¬های پیش رو در لرزه¬شناسی بازتابی است. در این پایان¬نامه به¬منظور شناسایی کف گنبد نمکی، نتایج نشانگرهای بافتی مبتنی بر ماتریس هم¬رخداد به¬عنوان ورودی به ماشین بردار پشتیبان که یک طبقه¬بندی کننده است، داده شده است. با طبقه¬بندی داده¬های لرزه¬ای توسط این ماشین، با دقت و وضوح بسیار بالا، محدوده جانبی و با دقت مناسب و قابل قبولی کف گنبد نمکی آشکارسازی شده است
فهیمه جمهوری حسین مروی
استفاده از ربات های اجتماعی در زندگی انسان ها افزایش یافته است و اصلی ترین راه ارتباط انسان ها با آنها ارتباط کلامی است. ربات های اجتماعی دارای میکروفونی هستند تا بتوانند سیگنال گفتار را برای ارتباط با انسان دریافت کنند. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص قسمت های گفتار در سیگنال های صوتی ضبط شده می باشد. هدف این پایان نامه طراحی یک سیستم آشکارساز فعالیت گفتاری است که بتواند با مشخص نمودن بخش های گفتار در یک محیط نویزی کارایی یک سیستم پردازش گفتار مورد استفاده برای یک ربات اجتماعی را افزایش دهد. در این پایان نامه، ویژگی های مختلفی جهت استخراج از سیگنال گفتار برای سیستم آشکارساز فعالیت گفتاری پیشنهاد شده است. این ویژگی ها با استفاده از ترکیب ویژگی انرژی با هر یک از ویژگی های ضرایب کپسترال فرکانس مل ریشه، ضرایب کپسترال فرکانس بارک، ضرایب پیش بینی ادراکی خطی و ضرایب پیش بینی ادراکی خطی تجدید نظر شده ارائه شده اند. روش پیشنهادی دیگری که در این پایان نامه مطرح شده بر مبنای ویژگی ویگنر ویل به عنوان یک روش استخراج ویژگی زمانی-فرکانسی است. این روش در مقایسه با روش های پیشنهادی مبتنی بر ویژگی انرژی و ویژگی های کپسترال، کارایی بهتری دارد. بنابراین برای افزایش کارایی روش های مبتنی بر ویژگی های کپسترال علاوه بر ویژگی انرژی، با ویژگی ویگنر ویل نیز ترکیب شده اند. برای ارزیابی کارایی روش های پیشنهادی، دادگان گفتاری فارس دات که یک پایگاه داده استاندارد و به زبان فارسی می باشد، به کار رفته است. با افزودن چند نوع متفاوت نویز به فایل های این پایگاه داده در شرایط مختلف نسبت سیگنال به نویز، مقاومت روش های پیشنهادی نسبت به نویزهای متفاوت سنجیده شده اند. آزمایشات نشان داده اند که برخی از روش های استخراج ویژگی پیشنهادی در این پایان نامه در مقایسه با روش متداول استخراج ویژگی ضرایب کپسترال فرکانس مل در محیطهای نویزی کارایی بهتری دارند.
محمدرضا عربعامری علیرضا احمدی فرد
در این پایان نامه روشی برای تشخیص متن در تصاویر مختلف طبیعی پیشنهاد شده است. در ابتدا کلیه تصاویر با پنجره های ۱۶×۱۶ بدون هم پوشانی مورد برسی قرارگرفته و ماتریس مشخص شده با عملگر hog استخراج می شود و پس ازاین مرحله با توجه به تعداد نسبتا مناسب ویژگی ها، مجموعا 40 ویژگی که برای هر بلوک در یک بردار 40 تایی ذخیره و با سه حالت روی نویسه، داخل نویسه و یا منطقه کاملا مستقل مشخص شده و مجموع پنجره های ۱۶×۱۶ با ویژگی متناظر آن به ورودی کلاسه بند اعمال می شود. با توجه به عدم بالانس بودن یا توازن بین تعداد ویژگی ها در کلاس ها با عمل همسان سازی تعداد ویژگی های، قسمت کلاس غیر متن با کلاس متن تقریبا برابر می شود تا در نهایت هنگام آموزش کلاسه بند دچار خطا و واگرایی نشود. چالش بسیار مهم انتخاب کلاسه بند مناسب از بین مجموعه الگوریتم های شبکه عصبی svm و روش های آماری بوستینگ ها می باشد که پس از تحلیل های انجام شده روش بوستینگ با هسته لاجیت بوست بر اساس درصد درستی، مناسب تر تشخیص داده شده و به عنوان الگوریتم کلاسه بند منتخب تعیین می شود. برای اعتبار سنجی و از بین بردن شرایط تصادفی آموزش و آزمایش از روش 10-fold cross validation استفاده شده است تا درصد های مربوط به کلاسه بند لاجیت بررسی شود و اعتبار انتخاب تأیید شود. در نهایت روش پیشنهادی اعم از پنجره بندی تصاویر، استخراج کل ویژگی ها و در نهایت اعمال کلاسه بند و مشخص کردن محل های متن پیاده سازی شده، با چند تصویر نمونه جدید مورد بررسی قرار می گیرد. نتایج خروجی نشان می دهد که الگوریتم پیشنهادی قادر است با درصد نسبتا قابل قبول محل متن را در تصویر مختلف بدون در نظر گرفتن مکان یا منظره پشت متن مشخص کند. لازم به ذکر است که متون انتخاب شده در این پیاده سازی بر اساس دیتابیس های استاندارد متون چاپ شده به زبان های انگلیسی یا آسیایی شرقی می باشد و این الگوریتم برای زبان های فارسی موردبررسی قرار نمی گیرد. در نهایت نتایج اعمال روش هم به صورت جدول و به صورت تصاویر در قسمت مربوط به نتایج آورده شده است تا صحت روش با تصویر مشخص شود.
علی شهنما حسین مروی
تخصیص نویسنده یکی از زیرشاخه های پردازش متن می باشد که هدف اصلی آن تعیین هویت نویسنده ی یک متن است. به عبارت دیگر هدف اصلی این حوزه، طراحی سیستمی است که بتواند هویت نویسنده ی یک متن را از میان چند نویسنده ی نامزد تعیین نماید. به منظور طراحی چنین سیستمی می بایست تعدادی متن از هر نامزد در اختیار داشته باشیم. تمامی پژوهش های گذشته در حوزه ی تخصیص نویسنده ی متون فارسی به روش های مبتنی بر سیستم های پردازش زبان های طبیعی (nlp) منحصر می شوند، اما هدف اصلی این پایان نامه بررسی عملکرد روش هایی موسوم به ndp بر روی مسائل تخصیص نویسنده ی زبان فارسی است. این روش ها بر مبنای تعداد تکرار انگرام ها طراحی شده و کاملاً مستقل از سیستم های nlp می باشند. در این پایان نامه مهم ترین روش های ndp موجود مطالعه شده و سپس با الهام از آن ها، دو روش جدید پیشنهاد شده است. در روش پیشنهادی اول (cng-wis) به جای استفاده از فرکانس انگرام ها، اندیس آن ها جهت حل مسائل به کار رفته است. در دومین روش پیشنهادی (vng) به جای آنکه انگرام های پرتکرار مبنای کار قرار گیرند، از انگرام های پراکنده استفاده شده است. به منظور ارزیابی روش های موجود و هم چنین مقایسه ی روش های پیشنهادی با آن ها، از چهار مجموعه متن (یا پایگاه داده) مختلف از دو زبان فارسی و عربی استفاده شده است. یکی از این مجموعه متن ها (به نام cppt) توسط نگارنده گردآوری شده و دارای 145متن از 6 نویسنده ی معاصر فارسی زبان می باشد. نتایج بدست آمده حاکی از آنست که علاوه بر روش های ndp موجود، روش های پیشنهادی نیز قدرت بالایی در حل مسائل تخصیص نویسنده ی زبان های فارسی و عربی دارند. در انتها، دو مسئله ی خاصِ حوزه ی ادبیات فارسی بررسی شده اند: نظیره های گلستان و غزلیات سبک هندی. بدین منظور دو مجموعه متن دیگر با نام های gbp (شامل 75 حکایت از سه نویسنده) و sbh (شامل 90 غزل به سبک هندی از سه شاعر) توسط نگارنده جمع آوری شده است. نتایج بدست آمده نشان می دهد که روش های ndp علاوه بر مسائل تخصیص نویسنده ی متون نثر فارسی، در حکایات (ترکیبی از نثر و نظم) و اشعار نیز قدرت بالایی دارند. کلمات کلیدی: تخصیص نویسنده، انگرام، روش های مبتنی بر پروفایل، نشانگر سبک، مجموعه متن cppt، مجموعه متن gbp و مجموعه متن sbh.
مریم بهمنی امیدرضا معروضی
سیستم حمل و نقل از مسائل مهم یک جامعه است. استفاده از سیستم های حمل و نقل هوشمند با بکارگیری تکنولوژی های نوین دارای مزایا قابل توجهی هستند. از مهمترین این مزایا، کاهش آمار تصادفات و سوانح جاده ای می باشد. در صنعت روز خودروسازیِ دنیا، استفاده روز افزون از تکنولوژی های متنوع هوشمند سازی به سرعت در حال گسترش است. با توسعه فناوری، ابزارهای هوشمند زیادی مانند رادار، سنسور، دوربین و دیگر تجهیزات مدرن در ساخت اتومبیل های امروزی به کار می روند که نقش زیادی در کاهش خطاهای انسانی، تصمیم گیری بموقع و واکنش سریع در برابر رخدادها و پیشامدهای ناگهانی در حین رانندگی دارند. از سیستم نمایش اطلاعات hud برای نشان دادن اطلاعات مهم در مرکز دید راننده استفاده می شود، بدون اینکه نیاز باشد راننده سر خود را حرکت دهد. این پایان نامه، طراحی و ساخت یک سیستم نمایش اطلاعات hud برای خودروها به منظور رانندگی مطمئن ارائه می دهد. سیستم نمایش اطلاعات hud، با بکارگیری تکنولوژی های نوین، قابلیت هدایت و کمک به راننده در شرایط سخت و حساس به منظور افزایش ایمنی و کاهش آمار تصادفات و سوانح جاده ای را دارد. به دلیل بالا بودن آمار تصادفات و رو به رشد بودن صنعت خودروسازی در ایران، استفاده از تکنولوژی های روز دنیا و آشنایی با سیستم های هوشمند درون خودرویی و تجهیز خودروهای جدید تولیدی به سیستم های امنیتی و امکانات هوشمند اهمیت بسیاری دارد و ضرورت آن بیش از گذشته احساس می شود. بنابراین، در این پژوهش، یک نمونه ی آزمایشگاهی این سیستم نمایش اطلاعات به صورت ابتدایی طراحی شده است. به منظور طراحی این سیستم، ابتدا یک سخت افزار مناسب جهت دریافت اطلاعات از سنسورها طراحی و ساخته شده است و از یک سخت افزار مناسب برای دریافت ویدیو و سپس جهت پردازش اطلاعات از یک برد صنعتی قابل حمل مبتنی بر پردازنده arm cortex-a8 استفاده شده است. کلمات کلیدی: سیستم hud، خودرو هوشمند، طراحی سیستم اپتیکی، میکروکنترلر arm.
روح اله علیان نژادی حسین خسروی
انتقال پ?ام به صورت مخف?انه از د?رباز ?ک? از ع?قمندیهای بـشر هوشـمند بـوده اسـت . بـا پ?شرفت فناوری روشهای انتقال مخف?انه پ?ام ?ا نهاننگاری آنها در رسـانه هـا ی د?گـر، پ?ـشرفت چشمگ?ری داشته اند.فرمت jpeg پرکاربرد تر?ن قالب تصو?ری در ارتباطات د?ج?تال اسـت و در ط? سال های اخ?ر روش های نهان نگاری متنـوع? بـرای آن ارائـه شـده اسـت هـدف از ا?ـن پایان نامه معرف? و ارائه اط?عات همه جانبه و کامل? در مورد روش های نهـان نگـاری در تـصو?ر jpeg و دسته بندی ا?ن روش ها و ارائه راهکارها?? برای با? بردن امن?ت آن هـا بـا توجـه بـه ساختار پوشانه م? باشد . در ا?ن راسـتا عوامـل تأث?رگـذار در امن?ـت روش هـای نهـان نگـاری در jpeg که وابسته به پوشانه م? باشد .مثل اثر دوبـار فـشرده سـازی ، فرکـانس مکـان? ، ضـر?ب ک?ف?ت و ... شناسا?? شده و به صورت تئوری و عمل? مورد ارز?اب? قرار گرفتـه اسـت . عـ?وه بـر ا?ن کل?ه ی الگور?تم های نهان نگاری موجود در ا?ن فرمت معرف? شده و از د?دگاه های مختلف ، ارز?اب? و دسته بندی شده اند .
محمد امیر نظری سیاه سر امین روشندل کاهو
تضعیف نوفه های تصادفی یک چالش اساسی در پردازش داده های لرزه ای است. این نوفه ها توسط نوسانات تصادفی در طول زمان و فرکانس بر روی سیگنال دریافتی تأثیر می گذارند. در این پایان نامه، ما به معرفی و ارزیابی یک روش برای تضعیف این نوفه ها بر اساس تجزیه یک ماتریس به دو مولفه "رتبه پایین" و "تُنک" خواهیم پرداخت. در این روش ابتدا یک ردلرزه توسط یک تبدیل زمان-فرکانس تنک در یک زیر فضای تنک جدید به نمایش در آورده می-شود. سپس این ماتریس در زیرفضای تنک توسط اَفکنش تصادفی دو جهته به دو مولفه بخش رتبه پایین و بخش تنک تجزیه می-شود. روش پیشنهادی در نهایت توسط اعمال بر روی داده های مصنوعی و واقعی آزمایش شده است. نوفه زدایی با دو روش دیگر در این حوزه مقایسه خواهد شد. ما در این پایان نامه نشان دادیم که روش پیشنهادی یک تکنیک موثر، با قابلیت حفظ دامنه سیگنال و پایدار در برابر نوفه خواهد بود و نتایج آن توسط دو معیار کمّی و کیفی بررسی شده و عملکرد مناسب این روش در بازیابی سیگنال به تصویر کشیده شده است.
محمد سلطان محمدی حسین خسروی
اندازه گیری سرعت وسایل نقلیه، نقش مهمی را در جمع آوری اطلاعات ترافیکی ایفا می کند و همچنین موضوع داغ و پیچیده ای در دستگاه های حمل و نقل هوشمند به حساب می آید. در این پایان نامه برای تخمین سرعت وسیله نقلیه از استخراج نقاط محوشوندگی درون تصویر استفاده شده است تا بتوان پارامترهای دوربین را محاسبه کرد و سرعت خودرویی که به ناحیه ی مورد علاقه وارد می شود را به صورت بلادرنگ محاسبه کرد. علاوه بر آن روشی برای شمارش وسایل نقلیه به صورت بلادرنگ نیز ارائه شده است.
نیما نقیه علیرضا احمدی فرد
در این پایان نامه هدف بازسازی تصویر چهره از طریق فراتفکیک پذیری بر مبنای یادگیری می باشد. یکی از روش های پیشنهاد شده به نام lps-gis شناخته شده است. در این روش پایگاهی از زوج تصاویر با تفکیک پذیری پایین و بالا جهت یادگیری رابطه بین این تصاویر تهیه شده سپس برای یک تصویر ورودی با تفکیک پذیری پایین تعدادی از تصاویر با تفکیک پذیری پایین در پایگاه داده که شباهت قابل قبولی با تصویر ورودی دارند انتخاب می شوند. در این روش الگوریتم pca به عنوان معیار شباهت به کار رفته است. در این پایان نامه معیارهای استخراج ویژگی hog، sift، surf به جای معیار مذکور مورد استفاده قرار گرفته است و نتایج حاصل از ویژگی های مذکور مورد بررسی قرار می گیرد.
علی حریمی علیرضا احمدی فرد
چکیده ناحیه بندی تصاویر اولین گام و یکی از مهم ترین بخش های یک سیستم بینایی ماشین یا پردازش تصویر می باشد، ازینرو خطای ناشی از این مرحله یک ورودی برای سایر بلوک های سیستم به شمار آمده و تاًثیر بسزایی در خطای کل سیستم خواهد داشت. بنابراین دقت این الگوریتم در کارآیی کلی سیستم نقش چشم گیری دارد .در این راستا هدف این تحقیق آن بوده است که روشی جدید برای ناحیه بندی تصاویر ارائه شود که دقت ناحیه بندی تصاویر را افزایش دهد. لازم به ذکر است که ناحیه بندی تصویر را می توان در دو حوزه ی ناحیه بندی با سرپرست و ناحیه بندی بدون سرپرست بررسی نمود. مبنای انجام این تحقیق ناحیه بندی بدون سرپرست می باشد. در این تحقیق ناحیه بندی بدون سرپرست را در سه شاخه ی ناحیه بندی تصاویر خاکستری، ناحیه بندی تصاویر رنگی و ناحیه بندی بافت ها مورد ارزیابی قرار خواهیم داد. برای ناحیه بندی تصاویر خاکستری هیستوگرام همبستگی را برای پیکسل های تصویر تعریف نموده و آن را بوسیله ی تلفیقی از توابع گوسی مدل می کنیم. آستانه های بهینه را برای ناحیه بندی تصویر از مدل تلفیقی مذکور بدست آورده و به تصویر مربوطه اعمال می کنیم. نتایج حاکی از بهبود عملکرد الگوریتم بویژه در تصاویر نویزی می باشد. برای ناحیه بندی تصاویر رنگی نیز یک روش جدید بر مبنای آستانه گذاری روی هیستوگرام ویژگی های مربوط به رنگ پیکسل های تصویر ارائه می کنیم. بدین منظور هیستوگرام رنگ را برای پیکسل های تصویر بدست آورده و با یک پیش پردازش آن را برای مدل سازی آماده می کنیم. سپس آستانه های مناسب را از مدل گوسی تلفیقی این منحنی بدست می آوریم. روش پیشنهادی در مقابل سایر روش های بررسی شده کارآیی بسیار خوبی دارد. بویژه در تصاویری که تحت تاًثیر نویز روشنایی محیط قرار گرفته اند کارآیی الگوریتم بصورت چشمگیر بهبود پیدا می کند. روش رایج ناحیه بندی بافت ها در تصاویر استفاده از فیلتر های گبور می باشد. اشکال عمده ی این روش حجم بالای محاسبات و وابستگی الگوریتم به پارامترهای بانک فیلتر طراحی شده می باشد. در این راستا روشی جدید ارائه نمودیم که از ویژگی های آماری توزیع روشنایی پیکسل های تصویر مانند میانگین و واریانس روشنایی پیکسل ها در همسایگی های با ابعاد مشخص استفاده می کند. نتایج حاکی از کارآمد بودن الگوریتم پیشنهادی می باشند.