نام پژوهشگر: علی حریمی
علی حریمی علیرضا احمدی فرد
تشخیص احساس از روی گفتار موضوعی میان رشته ای در حوزه ی روانشناسی، بازشناسی الگو و پردازش سیگنال می باشد که در دهه ی اخیر توجه بسیاری از پژوهشگران را به خود جلب نموده است. در این رساله با آنالیز تصویر طیف نگاره ی گفتار ویژگی های مبتنی بر الگوهای طیفی و انرژی هارمونیک ها را استخراج نمودیم. ویژگی های دینامیکی غیر خطی نیز با استفاده از بازسازی فضای فاز سه بعدی سیگنال گفتار استخراج شدند. سپس، از معیار فیشر برای فیلتر کردن ویژگی های نویزی استفاده گردید. الگوریتم های انتخاب متوالی رو به جلو و الگوریتم ژنتیک نیز بعنوان یک مرحله مکمل، برای انتخاب بردار ویژگی بهینه بکار گرفته شدند. به منظور طبقه بندی احساس های گسسته و پیوسته در پایگاه داده ی برلین و vam از طبقه بند و رگرسیون مبتنی بر ماشین بردارهای پشتیبان استفاده شده است. بر اساس نتایج آزمایش ها، ویژگی های دینامیکی غیرخطی در کاهش تداخل احساس های خشم و خوشحالی و به تبع آن در افزایش نرخ بازشناسی بسیار موثر می باشند. با استفاده از ویژگی های متداول عروضی و طیفی، بهترین نرخ تشخیص بدست آمده برای طبقه بندی احساس های خشم و خوشحالی برای زنان 78/83% و برای مردان 95/91% می باشد. با استفاده از ویژگی های دینامیکی غیرخطی این مقادیر بترتیب به 1/99% و 85/98% افزایش می یابند. برای طبقه بندی 7 احساس اولیه نیز بالاترین نرخ تشخیص بدست آمده با استفاده از سیستم پیشنهادی 34/92% (35/96% برای زنان و 18/87% برای مردان) می باشد. در بازشناسی احساس های پیوسته نیز با استفاده از ویژگی های متداول عروضی و طیفی بالاترین ضریب همبستگی برانگیختگی، جاذبه و سلطه بترتیب 99/83% و 53% و 4/83% بدست آمدند. با افزودن ویژگی های دینامیکی غیرخطی به این ویژگی ها، ضریب همبستگی برای برانگیختگی، جاذبه و سلطه بترتیب 06/85% و 39/53% و 68/84% محاسبه گردید.
بهاره قدیمی سعیده فردوسی
در این پایان نامه، روشی برای تشخیص زود هنگام بیماری رتینوپاتی دیابتی به کمک آنالیز تصاویر پزشکی شبکیه با استفاده از تبدیل ویولت و تجزیه ماتریس نامنفی( nmf) ارائه شده است. در اولین مرحله پیش پردازش تصاویر شبکیه به منظور افزایش کیفیت انجام می شود. سپس تبدیل موجک به منظور استخراج ویژگی روی تصویر پیش پردازش شده اعمال می شود. در این پایان نامه از تبدیل موجک haar در دو سطح استفاده شد. پس از اعمال تابع موجک تصاویر به دست آمده برای ساخت ماتریس مشاهدات در تبدیل nmf مورد استفاده قرار می گیرند. با اعمال تبدیل nmf در ماتریس مشاهدات دو ماتریس به دست می آیند که یکی شامل اجزای مختلف تصویر شبکیه (ماتریس سورس) و دیگری شامل ضرایب مربوط به هر سورس می باشد. از بررسی نتایج حاصله از تبدیل nmf به این نتیجه رسیدیم که سطر های دوم و سوم ماتریس سورس حاوی اطلاعات مربوط به اگزودا می باشند. نکته جالب توجه که در این الگوریتم تحقق یافت حذف دیسک نوری در این سورس ها می باشد که دارای طیف روشنایی مشابه با اگزودا است به منظور بهبود درجه آشکاری جراحات، سورس های حاوی اطلاعات جراحات (سورس دوم و سوم) بعنوان ماسک بر روی تصویر اصلی (سورس اول) استفاده شدند، بنابراین دیسک نوری و رگ های خونی و اجزای غیر جراحت در تصویر حاصل تضعیف شده و اگزوداها بصورت واضحتری مشخص می باشند. نتیجه حاصل از این مرحله برای استخراج ویژگی های آماری مورد استفاده قرار گرفت. پس از این مرحله در نهایت از بین کلاسه بندهای مختلف روش بوستینگ با هسته logitboost بهترین درصد درستی، حساسیت و ویژگی را از خود نشان داد. لازم به ذکر است که در این مرحله انواع مختلف طبقه بندی کننده های دیگر یا هسته های مختلف بوستینگ نیز مورد بررسی قرار گرفت. برای از بین بردن شرایط تصادفی آموزش و آزمایش، از روش 10-fold cross validation استفاده شد تا درصدهای بدست آمده از اعتبار کافی برخوردار باشند در پایان بر اساس کلاسه بند و ویژگیهای انتخاب شده ، نتایج حاصل بصورت جدول و تصویر آورده شده که بیانگر درستی و قابل اعتماد بودن روش پیشنهادی است.
حسن باچ علی حریمی
تشخیص احساس از روی سیگنال گفتار یکی از شاخه های نسبتا جدید در پردازش گفتار می باشد که می تواند در تعامل انسان و ربات نقش مهمی ایفا کند و در حوزه های روانشناسی و روانپزشکی، فن-آوری اطلاعات و صنعت و تجارت کاربرد زیادی دارد. ما در این تحقیق یک سیستم تشخیص احساس از روی گفتار طراحی نموده ایم، که بدین منظور از ویژگی های عروضی و طیفی سیگنال گفتار استفاده گردیده است و نتایج حاصل از انجام آزمایشات بدست آمده از روش پیشنهادی بازسازی فضای فاز، با آزمایشاتی که بر روی پایگاه داده معروف برلین با استفاده از ویژگی های عروضی و طیفی سیگنال گفتار انجام گرفت مقایسه شده است. ابتدا سیستم مورد نظر برای گویندگان مختلط و سپس برای گویندگان زن و مرد به طور جداگانه، طراحی شده است. سپس داده ها با استفاده از طبقه بندهای مختلف از جمله ماشین بردار پشتیبان با کرنلrbf طبقه بندی گردیده اند. در هر دو روش آزمایش، بالاترین نرخ تشخیص به ترتیب برای سیستم گویندگان زن، گویندگان مختلط و گویندگان مرد با استفاده از طبقه بند ماشین بردار پشتیبان با کرنلrbf به دست آمده است. بهترین میانگین نرخ تشخیص بدست آمده برای سیستم گویندگان مختلط، زن و مرد با روش پیشنهادی به ترتیب 91.21%، 96.67% و 85.47 % و میانگین نرخ تشخیص سیستم تفکیک جنسیتی شده نیز 91.77% می باشد. همچنین میانگین نرخ تشخیص بدست آمده برای سیستم گویندگان مختلط، زن و مرد با ویژگی های طیفی و عروضی به ترتیب 89.34 % ،96.67% و 89.31 % و میانگین نرخ تشخیص سیستم تفکیک جنسیتی شده نیز 93.45% می باشد. نتیجه می گیریم که تفکیک جنسیتی نرخ تشخیص سیستم را در روش پیشنهادی از عدد 91.21% به عدد 91.77% و در روشی که آزمایشات را با ویژگی های طیفی و عروضی انجام دادیم از عدد 89.34 % به عدد 93.45% بهبود بخشیده است.
دانیال بی غم کلائی مجتبی واحدی
عیب در سیستم های عایقی در اثر پروسه های الکتریکی ، مکانیکی و حرارتی ناشی از ساخت و یا بهره برداری از آنها ایجاد می شود. ایجاد این عیوب، باعث کاهش موضعی استقامت الکتریکی سیستمهای عایقی شده که تخلیه جزئی (partial discharge) را در محل عیب بدنبال خواهد داشت. وجود منافذ، حفره ها و یا کانال های تخلیه الکتریکی به شکل درخت در عایق های الکتریکی باعث بالا رفتن شدت میدان الکتریکی و به وقوع پیوستن تخلیه جزئی در این نقاط خواهد شد. ادامه این تخلیه جزئی که بصورت جرقه های کوچکی می باشد، بتدریج باعث خورده شدن عایق و در نهایت خرابی کامل دستگاه می شود. بنابراین برای اطمینان از عملکرد مطمئن تجهیزات فشار قوی، آشکارسازی پالس های تخلیه جزئی جهت تشخیص و مکان یابی عیوب داخلی عایق ها، حائز اهمیت زیادی می باشد. موضوع این پایان نامه مطالعه پدیده تخلیه جزئی(دلایل ایجاد پدیده، مدل ریاضی pd، مقایسه روش ها و ...)،کمیت های مربوطه، روش های آشکار سازی پالس های تخلیه جزئی مانند (الکتریکی و غیر الکتریکی)، بررسی تاثیر دما بر عملکرد خازن و تخلیه جزئی و شبیه سازی pd برای یک ماشین الکتریکی است.
عقیل کشیرتقرتپه علی حریمی
در این پایان نامه یک روش تشخیص علائم ترافیک برای علائم دایره ای (منع کننده و اجبار کننده) ، و برای علائم مثلثی (خطر) ارائه می شود. در اینجا از روش هیستوگرام گرادیان شیب دار(hog) و دو پنجره لغزان بزرگ و کوچک استفاده شده است. نامزد منطقه مورد علاقه(roi) ما برای اولین بار ، در پنجره کوچک کشف می شود ، و در یک پنجره اندازه بزرگ با دقت بالاترمورد تایید قرار می گیرد. در مقایسه با الگوریتم اصلی hog ، که از پنجره لغزان سایز ثابت استفاده می کند ، روش پیشنهادی دو پنجره بزرگ و کوچک دارای دو مزیت زیر است: اول، برای الگوریتم اصلی hog ، اندازه پنجره بسیار کوچک شده است که کوچکترین علائم ترافیک تشخیص داده شود ، این کار منجر به کم شدن دقت تشخیص می شود. در روش ارائه شده ، پنجره های کوچک مورد استفاده در فیلتر بزرگ مطمئن می سازد که کوچکترین علامت ترافیکی را می توان شناسایی کرد ، و پنجره های سایز بزرگ مورد استفاده در فیلتر کوچک ، فراخوان و دقت بالا را تضمین می کند. دوم، فیلتر بزرگ کارآمدتر و فیلتر کوچک دقیق تر است، ترکیب دو فیلتر روش پیشنهادی ، کارآمد تر از الگوریتم اصلی hog و روشهای مورد استفاده قبلی است در حالی که دقت از دست نمی رود.
عباس حسین پور علی حریمی
در این پایان نامه سعی شده است به مقوله تشخیص احساس از روی گفتار (ser) بپردازیم. برای این منظور از روش بازسازی فضای فازی استفاده می نماییم. به این معنا که با اعمال تأخیر زمانی روی نمونه ها ی جملات پایگاه داده، نمونه ها در یک فضای سه بعدی نگاشت می شوند. سپس با اعمال توابع نمایی، ریشه سوم، توان سه و تابع لگاریتمی، نقاط در فضای فاز پراکنده می شوند. در این روش، نرخ تشخیص احساس در سیگنال های گفتار برای ویژگی های بازسازی فضای فاز، بهبود قابل توجه ای حاصل شده است. در حالت ترکیب با سایر ویژگی های طیفی و عروضی، درمجموع نرخ تشخیص مساوی با آخرین دستاوردها می باشد که این موضوع اهمیت ویژگی های پیشنهادی را نشان می دهد. ما در این تحقیق از پایگاه داده برلین که به زبان آلمانی می باشد استفاده کرده ایم و به منظور بازسازی فضای فازی و استخراج ویژگی از نرم افزار matlab استفاده نموده ایم. همچنین برای طبقه-بندی احساسات از طبقه بند ماشین بردار پشتیان (svm) با کرنل rbf به کمک نرم افزار weka استفاده شده است. بهترین نرخ تشخیص احساس در این تحقیق با استفاده از بردار ویژگی بازسازی فضای فازی 1000 سلولی با اعمال تابع ریشه سوم به عدد 60.56 درصد رسیده است. همچنین با استفاده از بردار ویژگی بازسازی فضای فازی 125 سلولی و ترکیب با سایر ویژگی های طیفی و عروضی به عدد 91.21 درصد رسیده است. واژگان کلیدی: بازسازی فضای فازی، پردازش گفتار، تشخیص احساس، استخراج ویژگی ?
محمد خواجه افلاطون رضا داورزنی
همزمان با پیشرفت هایی که در زمینه ویرایش و پردازش تصویر صورت گرفته است، امکان تغییر و دستکاری تصاویر بدون ایجاد کوچکترین اثری در آن ها نیز بوجود آمده است، بگونه ای که دیگر نمی توان تنها با نگریستن به تصاویر، جعلی و ساختگی بودن آنها را تشخیص داد. با وجود این مساله صحت و جامعیت تصاویر زیرسوال رفته است و محتویات تصاویر دیگر قابل اعتماد نیستند. جعل تصویر انواع مختلفی دارد و راه های زیادی برای تحریف محتوی یک تصویر وجود دارد. جعل کپی نواحی تصویر (کپی و انتقال) ، نوع خاصی از جعل تصویر می باشد که در آن ناحیه ای از تصویر در ناحیه ی دیگری از آن کپی می گردد، تا بدین ترتیب قسمت های ناخواسته تصویر حذف و یا قسمت های مورد نظر اضافه گردد. در این تحقیق در راستای کشف جعل کپی نواحی تصویر، سعی بر ارائه روشی داریم که از نظر پیچیدگی محاسباتی ساده تر و در عین حال کارایی لازم را داشته باشد. یکی از مهم ترین بخش های الگوریتم های تشخیص جعل کپی نواحی تصویر، مرحله استخراج ویژگی از تصویر است. بعبارت دیگر، بایستی با استخراج ویژگی های مناسب و تطابق این ویژگی ها با یکدیگر بخش های جعل شده تصویر را شناسایی نماییم. در این تحقیق سعی نمودیم که با انتقال تصویر به فضاهای مختلف و استخراج ویژگی در هر فضا و ترکیب آن ها به روشی مقاوم و کارا برای تشخیص جعل کپی نواحی دست یابیم. برای انتقال تصویر از تبدیل های پردازشی مختلفی همانند تبدیل کسینوسی گسسته (dct) ، تبدیل الگوهای باینری محلی ، تبدیل ویولت (موجک) گسسته ، تبدیل تجزیه به مولفه های تکین (svd) ، تبدیل ملین فوریه (fmt) استفاده نمودیم. روش پیشنهادی براساس بلوک بندی تصویر و استخراج و تطابق ویژگی های بلوکی می باشد. در روش پیشنهادی از دو تکنیک مرتب سازی براساس قواعد واژه نگاری و درخت k-بعدی برای کاهش زمان مراحل جستجو استفاده شده است. نتایج آزمایشات نیز عملکرد قابل قبول روش پیشنهادی را در شناسایی نواحی جعل شده کوچک و همچنین در برابر حملات پس پردازشی مختلف نشان می دهد.
علی حریمی علیرضا احمدی فرد
چکیده ناحیه بندی تصاویر اولین گام و یکی از مهم ترین بخش های یک سیستم بینایی ماشین یا پردازش تصویر می باشد، ازینرو خطای ناشی از این مرحله یک ورودی برای سایر بلوک های سیستم به شمار آمده و تاًثیر بسزایی در خطای کل سیستم خواهد داشت. بنابراین دقت این الگوریتم در کارآیی کلی سیستم نقش چشم گیری دارد .در این راستا هدف این تحقیق آن بوده است که روشی جدید برای ناحیه بندی تصاویر ارائه شود که دقت ناحیه بندی تصاویر را افزایش دهد. لازم به ذکر است که ناحیه بندی تصویر را می توان در دو حوزه ی ناحیه بندی با سرپرست و ناحیه بندی بدون سرپرست بررسی نمود. مبنای انجام این تحقیق ناحیه بندی بدون سرپرست می باشد. در این تحقیق ناحیه بندی بدون سرپرست را در سه شاخه ی ناحیه بندی تصاویر خاکستری، ناحیه بندی تصاویر رنگی و ناحیه بندی بافت ها مورد ارزیابی قرار خواهیم داد. برای ناحیه بندی تصاویر خاکستری هیستوگرام همبستگی را برای پیکسل های تصویر تعریف نموده و آن را بوسیله ی تلفیقی از توابع گوسی مدل می کنیم. آستانه های بهینه را برای ناحیه بندی تصویر از مدل تلفیقی مذکور بدست آورده و به تصویر مربوطه اعمال می کنیم. نتایج حاکی از بهبود عملکرد الگوریتم بویژه در تصاویر نویزی می باشد. برای ناحیه بندی تصاویر رنگی نیز یک روش جدید بر مبنای آستانه گذاری روی هیستوگرام ویژگی های مربوط به رنگ پیکسل های تصویر ارائه می کنیم. بدین منظور هیستوگرام رنگ را برای پیکسل های تصویر بدست آورده و با یک پیش پردازش آن را برای مدل سازی آماده می کنیم. سپس آستانه های مناسب را از مدل گوسی تلفیقی این منحنی بدست می آوریم. روش پیشنهادی در مقابل سایر روش های بررسی شده کارآیی بسیار خوبی دارد. بویژه در تصاویری که تحت تاًثیر نویز روشنایی محیط قرار گرفته اند کارآیی الگوریتم بصورت چشمگیر بهبود پیدا می کند. روش رایج ناحیه بندی بافت ها در تصاویر استفاده از فیلتر های گبور می باشد. اشکال عمده ی این روش حجم بالای محاسبات و وابستگی الگوریتم به پارامترهای بانک فیلتر طراحی شده می باشد. در این راستا روشی جدید ارائه نمودیم که از ویژگی های آماری توزیع روشنایی پیکسل های تصویر مانند میانگین و واریانس روشنایی پیکسل ها در همسایگی های با ابعاد مشخص استفاده می کند. نتایج حاکی از کارآمد بودن الگوریتم پیشنهادی می باشند.