نام پژوهشگر: هادی صدوقی یزدی

تشخیص آریتمی های قلبی بر پایه الکتروکاردیوگرام با استفاده از الگوریتم های فراکاوشی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388
  جلال الدین نصیری   محمود نقیب زاده

بیماری های قلبی بنا بر آمارهای سازمان جهانی بهداشت شایعترین علت فوت را در میان سایر بیماری ها به خود اختصاص می دهند. تشخیص سریع و مراقبت ویژه پزشکی از بیماران مبتلا به این امراض می تواند تا حد زیادی از مرگ ناگهانی آنها جلوگیری نماید. از میان وسایل و راه های تشخیص مورد استفاده در این بیماری ها، استفاده از الکتروکاردیوگرام (electrocardiogram:ecg) کاربرد وسیع و قابل توجهی دارد. با توجه به اینکه ثبت نوار قلب آسان، کم هزینه و در عین حال ثمر بخش می باشد، استفاده از آن برای تشخیص مفید است. به علت حجم کاری فراوان متخصصین قلب، خستگی و بی خوابی ایشان، احتمال تشخیص اشتباه بیماری وجود دارد. برای کاستن از این اشتباهات و کمک به پزشکان، می توان از روشهای هوشمند در تشخیص این بیماری ها استفاده نمود. تغییر و اعوجاج در هریک از پارامترهای اصلی سیگنال الکتروکاردیوگرام می تواند نشان دهنده یک بیماری قلبی باشد. هر یک از این تغییرات نابهنجار به طورکلی یک "آریتمی قلبی" نامیده می شود. هدف اصلی این تحقیق، بدست آوردن روشی اتوماتیک و کارا جهت تشخیص و تفکیک بیماری های قلبی بلوک شاخه ای راست ، بلوک شاخه ای چپ ، پیس ریتم و حالت نرمال و طبیعی از یکدیگر می باشد. برای این منظور یک سیستم طراحی شد تا ویژگی هایی را از سیگنال قلب استخراج کند. در گام بعد با استفاده از روش های موجود و نیز روش پیشنهادی بر پایه الگوریتم ژنتیک ویژگی های مناسب از بین مجموعه ویژگی ها انتخاب می شود. این گام بسیار مهم بوده و سبب دقت سیستم به صورت چشمگیری می شود. در نهایت مشخصه های انتخاب شده به یک کلاس بند چند کلاسی dag svm و dag esvm داده می شود و ضربان های متفاوت در هر یک از گروه ها دسته بندی می شوند.

بررسی تأثیر توجه مضاعف به نمونه های یادگیری با استفاده از قیود بهینه سازی طبقه بندهای ماشین بردار پشتیبان
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده فنی و مهندسی 1392
  مصطفی سبزه کار   محمود نقیب زاده

بدون شک نیاز عصر امروز بشر، با توجه به غوطه‏ور شدن در حجم وسیعی از داده‏های پیرامونش، استفاده از ابزارهایی برای تحلیل این داده‏ها و دستیابی به دانش نهفته‏ی درون آنهاست. طبقه‎بندی داده‎ها یکی از ابزارهای مهم در استخراج دانش از داده‎هاست. یکی از مشکلاتی که در هر روش طبقه‏بندی داده‏ها پیش روی داریم، بدست آوردن بهترین مدل است. اهمیت این قضیه وقتی آشکار می‏شود که بدانیم مجموعه داده‏هایی که برای آموزش این مدل استفاده شده‏ است، دارای داده‏های پرت، نویزی و یا به طور کلی کم اهمیت هم بوده است. در نتیجه مدل بدست آمده نمی‏تواند نتایج خوبی را در تشخیص داده‏های جدید گزارش نماید. بنابراین کلیه‏ی برنامه‏های داده‏کاوی از جمله طبقه‏بندی، بخش عمده‏ای از کار خود را روی تحلیل و کم‎کردن تأثیر این داده‏ها صرف می‏کنند. یکی از محبوب‏ترین روش‏های طبقه‏بندی داده‏ها ماشین‎های بردار پشتیبان (svm) هستند. ابرسطح جداکننده ای که توسط این روش بدست می‎آید فقط به بخش کوچکی از داده‎های آموزش بستگی دارد. در نتیجه svm نسبت به داده‎های نویزی و پرت بسیار حساس است. از طرف دیگر اهمیت تمام داده‎هایی که در آموزش شرکت می‎کنند، یکسان در نظر گرفته می‎شود. هدف اصلی در این تحقیق، اهمیت دادن به نمونه‎های یادگیری با استفاده از قیود موجود در مسأله‎ی بهینه‎سازی svm است. بدین ترتیب مشکل دیگر در آموزش svm که همواره بین انتخاب یک حاشیه بزرگ‎تر و کم‎کردن خطای در آموزش سیستم یک تضاد وجود دارد، به نحوی تبدیل به یک هدف شده و مرتفع می‎گردد و زیادتر کردن آگاهانه‏ی خطا تأثیر منفی بر مسأله‏ی بیشینه کردن ناحیه‏ی بین دو کلاس نخواهد داشت. ساختار svm در روش پیشنهادی به نحوی تغییر می‎کند که قادر است در مقابل داده‎های نویزی و پرت مقاوم‎تر باشد. از مزایای دیگر روش ارائه شده در نظر گرفتن تحمل و همچنین درجه‎ی قطعیت برای داده‎هاست که تاکنون در هیچ‎کدام از توسعه‎هایی که برای svm داده شده، مطرح نگردیده است. آزمایش‎های مختلف با استفاده از مجموعه داده‎های متعدد کارایی این الگوریتم برای مسائل مختلف یک کلاسی، دو کلاسی و چند کلاسی را اثبات کرد.

ارائه روشی مبتنی بر مرز برای توصیف داده ها و کاربرد آن در تشخیص نفوذ به شبکه های کامپیوتری
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388
  محمد قاسمی گل   رضا منصفی

امروزه با گسترش شبکه¬های کامپیوتری، بحث امنیت شبکه¬ها بیش از گذشته مورد توجه قرار گرفته است. به-طوری¬که می¬توان به کمک یک جستجوی ساده در اینترنت و مشاهده صفحات فراوان یافت شده به اهمیت این موضوع پی¬برد. یکی از اجزای اساسی برقراری امنیت در شبکه¬های کامپیوتری تشخیص نفوذ به آن¬ها می¬باشد که هدف اصلی آن کنترل ترافیک شبکه و تحلیل رفتارهای کاربران است. بنابراین سیستم¬های تشخیص نفوذ به شبکه¬های کامپیوتری نقش مهمی در حفظ امنیت و جلوگیری از دسترسی¬های غیر مجاز به شبکه ایفا می¬کنند. تاکنون روش¬های متعددی برای حل مسأله تشخیص نفوذ ارائه شده است که در این میان تکنیک¬های داده-کاوی و یادگیری ماشین بیش از سایر روش¬ها مورد استفاده قرار گرفته¬اند. از طرف دیگر ماهیت مسأله تشخیص نفوذ به گونه¬ای است که می¬توان آن¬را به¬صورت یک مسأله دسته¬بندی داده¬ها با هدف شناسائی نمونه¬های حمله از نمونه¬های نرمال در نظر گرفت. بر این اساس می¬توان روش¬های مختلف دسته¬بندی داده¬ها را برای حل این مشکل به¬کار گرفت. در بین روش¬های متعدد دسته¬بندی داده¬ها، دسته¬بندهای یک¬کلاسی به دلیل توانایی در تشخیص نمونه-های پرت و دقت بالا در شناسایی نمونه¬های نویزی به¬عنوان گزینه مناسبی در حل مسأله تشخیص نفوذ به شبکه¬های کامپیوتری محسوب می¬شوند. از¬این¬رو هدف اصلی تحقیق فوق بر روی طراحی و پیاده¬سازی روشی جدید در دسته¬بندی داده¬ها بنا شده است. روش پیشنهادی بر پایه یکی از مشهورترین دسته¬بندهای یک¬کلاسی بنا شده است و بهترین مرز موجود برای توصیف داده¬های کلاس هدف را ایجاد می¬کند. مرز بدست آمده می-تواند به¬عنوان سطح تصمیمی مناسب جهت تشخیص نمونه¬های نرمال از نمونه¬های غیر¬نرمال مورد استفاده قرار گیرد. در این پروژه برای ارزیابی توانایی روش ارائه شده در تشخیص نفوذ به شبکه¬های کامپیوتری، آنرا بر روی یکی از مشهورترین مجموعه¬های داده¬ای مربوط به تشخیص نفوذ (kdd-cup99) تست نموده¬ایم. نتایج بدست آمده حاکی از قدرت این روش در فرایند شناسایی نمونه¬های حمله دارد (هرچند میزان هشدارهای غلط سیستم نیز در سطح قابل قبولی است). به¬طور¬کلی با استفاده از این تکنیک می¬توان به نرخ دسته¬بندی صحیح بالاتر از 95 درصد دست یافت که این میزان در میان روش¬های منفرد ارائه شده جهت تشخیص نفوذ، نرخ تشخیص بالایی محسوب می¬گردد. مهم¬ترین مزیت این روش در مقایسه با روش¬های مشابه قابلیت شناسایی حملات جدید در آن است. روش پیشنهادی با توجه به نرخ خطای بسیار کم در شناسایی نمونه¬های حمله می-تواند در آینده به¬عنوان یکی از الگوریتم¬های بکار رفته در سیستم¬های ترکیبی تشخیص نفوذ مورد استفاده قرار گیرد.

ارائه یک الگوریتم تکاملی ترکیبی بر پایه الگوریتم ژنتیک و pso و بررسی کارایی آن در خوشه بندی بر مبنای شکل داده
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1388
  نوید عربی   هادی صدوقی یزدی

امروزه الگوریتم های تکاملی نظیر الگوریتم ژنتیک و الگوریتم بهینه سازی گروهی ذرات در حل بسیاری از مسائل پیچیده که روش های عددی قادر به حل آن نیستند و یا در حل آن دچار مشکلاتی می شوند، کاربرد دارند. مسئله خوشه بندی نیز یکی از این چنین مسائل است و با توجه به کاربرد و اهمیت بالای این موضوع، محققین همواره در پی یافتن روشی کامل و دقیق برای حل این مسئله بوده اند. اما با توجه به ماهیت این موضوع، روش های عددی موجود قابلیت حل این مسئله را ندارند و معضل پاسخ های محلی همواره در این روش ها مشکل ساز بوده است. در خوشه-بندی فازی با توجه به شکل داده این مشکل افزایش یافته و علاوه بر آن مشکل نیاز به پیش پردازش داده ها نیز به آن افزوده شده است، لذا از الگوریتم های تکاملی برای حل این مسئله استفاده شده است. اما دقت نسبتا پایین الگوریتم ژنتیک و به دام افتادن الگوریتم بهینه سازی گروهی ذرات در پاسخ های محلی از معایب بزرگ این دو روش بوده و کارایی آنها را نیز پایین می آورد. در این پایان نامه سعی شده با ترکیب این الگوریتم ها و با استفاده از نقاط قوت آنها، یعنی سرعت همگرایی بالای الگوریتم بهینه سازی گروهی ذرات و قدرت اکتشاف الگوریتم ژنتیک، الگوریتمی بدون معایب قبلی ایجاد شود. بدین منظور سه الگوریتم ترکیبی با ایده های متفاوت پیشنهاد گردیده و بعد از بررسی و بهبود با یکدیگر به رقابت گذاشته شده اند و کارایی الگوریتم برگزیده با کارایی الگوریتم های پایه مقایسه شده است. برای ارزیابی کارایی الگوریتم ها از مجموعه داده های استاندارد برای داده های توده ای و اشکال معمول و متعارف برای خوشه بندی پوسته ای استفاده شده است. معیارهای ارزیابی از بین معیارهای استاندارد خوشه بندی و فاکتورهای اعتبارسنجی خوشه بندی انتخاب شده است. در تمامی ارزیابی های انجام شده الگوریتم پیشنهادی کارایی بهتری از الگوریتم های پایه نشان داده است.

ارائه راهکاری جامع برای مقابله با spit در شبکه های voip
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390
  حسین خسروی رشخواری   محمد حسین یغمایی مقدم

قابلیت انعطاف سیستم های voip و همگرا شدن دیتا و صوت در این شبکه ها، به همراه خود ریسک های امنیتی بوجود می آورد و عمومی شدن voip در شبکه های سازمانی را به تعویق و تاخیر می اندازد. این ریسک ها به نگرانی های عمومی امنیتی که در خود شبکه های ip وجود دارد، افزوده می شود. شناخت دقیق حفره های امنیتی، بدون تسلط بر تکنولوژی و پیاده سازی های مختلف voip امکان پذیر نیست، از این رو در پایان نامه حاضر، با اشاره به پروتکل های مختلف استاندارد شده در voip، پرکاربردترین استاندارد حال حاضر یعنی sip، به دقت مورد بررسی قرار داده شده و سپس مشکلات امنیتی این پروتکل مورد بررسی و تحقیق قرار می گیرد. یکی از مهم ترین نگرانی های امنیتی voip، نحوه مدیریت بحران پیش رو برای مواجهه با spam over internet telephony (spit) می باشد. با توجه به اهمیت این موضوع و عدم وجود راهکار های جامع در این حوزه، تمرکز پایان نامه بر روی بررسی ابعاد این مشکل، بررسی راه حل های موجود و نهایتاً ارائه راهکاری جدید و جامع برای مقابله با spit معطوف شده است. در این پایان نامه، یک راهکار ماژولار با ترکیب دقیقی از یک کلاسیفایر، به گونه ای پیاده سازی شده که تماس ورودی پس از بررسی اولیه توسط یک سیستم بدون نظارت (unsupervised)، در صورت وجود قطعیت لازم در تصمیم، برای آموزش داده ها، به یک سیستم تحت نظارت (supervised: کلاسیفایر fast-svdd) منتقل می گردد. در صورت عدم وجود قطعیت، تماس برای ارزیابی به مقصد منتقل شده و پس از کسب نتیجه به کلاسیفایر تعلیم داده خواهد شد. ضمنا رفتار اسپیتر ها مدل شده و داده های مورد ارزیابی از مدل ارائه شده استخراج شده اند. پیش بینی می شود چهارچوب ارائه شده با اجرای صحیح در یک شبکه واقعی کارایی بالایی از خود نشان دهد.

انتخاب بردارهای ویژه و تبدیل فضا در خوشهبندی طیفی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده فنی و مهندسی 1390
  سهیلا اشکذری طوسی   هادی صدوقی یزدی

خوشه بندی یکی از مهم ترین ابزارهای شناسایی الگو در استخراج دانش و دسته بندی اطلاعات می باشد. روش های مختلفی برای خوشه بندی ارائه شده است که هر یک سعی دارند تا بهترین گروه بندی را برای مجموعه داده مورد بررسی ارائه دهند. اما هنگامی که داده ها ساختاری غیرخطی و نامحدب داشته باشند، روش های کلاسیک خوشه بندی قادر به افراز صحیح داده ها نمی باشند. خوشه بندی طیفی یک راه حل مناسب برای چنین مسائلی می باشد. در خوشه بندی طیفی با مدل کردن میزان شباهت داده ها و استفاده از بردارهای ویژه انواع ماتریس های لاپلاسین، سعی شده است تا با ارائه الگوریتم های مختلف، از دانشی که در مجموعه داده وجود دارد برای افراز آن استفاده شود. برای این منظور، بردارهای ویژه ماتریس لاپلاسین بر اساس ترتیب نزولی مقادیر ویژه شان مرتب شده و تعداد محدودی از این لیست مرتب شده برای بازنمایی داده ها انتخاب می شوند. اما این ترتیب همیشه توانمندترین بردارهای ویژه را در اختیار ما قرار نمی دهد. در این پایان نامه، سعی شده است تا مسئله انتخاب بهترین بردارهای ویژه را در قالب یک مسئله بهینه سازی درجه دوم مقید آمیخته، ارائه و حل نماییم. در نظر گرفتن میزان کارایی هریک از بردارهای ویژه به طور مجزا، در توصیف ساختار داده ها و همچنین توجه به میزان ارتباط بردارهای مختلف با یکدیگر معیارهایی می باشند که در مدل پیشنهادی درنظر گرفته شده اند. علاوه بر این، یکی دیگر از مشکلات عمده در خوشه بندی داده ها، وجود داده های نویزی و پرت در مجموعه داده می باشد. در قسمت دوم روش پیشنهادی در این پایان نامه، مدلی را ارائه نمودیم که طی آن با افراز مجموعه داده به چندین زیرخوشه و مدل نمودن مرز زیرخوشه ها، میزان شباهت داده ها به این زیرخوشه ها را محاسبه و سپس از این اطلاعات در الگوریتم خوشه بندی طیفی برای افراز داده ها بهره بردیم. نتایج آزمایش ها به روی مجموعه داده های واقعی و مصنوعی بیانگر موفقیت هر دو روش پیشنهادی می باشد.

طبقه بند تک کلاسه گرانش گرایِ svdd نما
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390
  یونس اله یاری   هادی صدوقی یزدی

در سالهای اخیر ماشین بردار پشتیبان svdd بطور فزاینده ای در کاربردهای مرتبط با طبقه بندی تک کلاسه، مورد استفاده قرار گرفته است. هدف svdd ارائه یک توصیف فشرده از مجموعه ای از داده ها بنام کلاس هدف است بطوریکه فضای توزیع این داده ها را از فضای نمونه های دیده نشده مرتبط با سایر کلاسها جدا کند. یکی از چالشهای svdd این است که مرز آن تنها با نمونه های بیرونی توصیف شده و نمونه های داخلی و چگالی توزیع داده ها دخالتی در تعیین مرز ندارند. در این پایان نامه با محور قرار دادن svdd طبقه بند جدیدی پیشنهاد می شود که مرکز گرانش به نمایندگی همه نمونه های یادگیری در تعیین مرز دخالت دارد، ضمن اینکه بصورت ضمنی چگالی توزیع داده ها را در محاسبه مرز دخالت می دهد. آزمایشها نشان می دهند که طبقه بند جدید در اغلب موارد نسبت به svdd و گونه های توسعه یافته آن نرخ شناسائی بهتری دارد.

ارائه رهیافتی جدید برای تولید پیکره موازی انگلیسی-فارسی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391
  سید احمد جکیان طوسی   محسن کاهانی

در این پژوهش، برای اولین بار مدلی ترکیبی برای تراز بندی جملات، جهت ساخت پیکره های موازی انگلیسی-فارسی ارائه شده است. در حالت کلی چارچوب روش پیشنهادی، غیر وابسته به زبان های مبدأ و مقصد بوده و از آن می توان برای تولید پیکره های موازی، برای هر جفت زبان دیگر، نیز استفاده کرد. نتایج بدست آمده از پیاده سازی ها نشان می دهد که بکار بردن ویژگی های زبانی و غیر زبانی ، عملکرد سیستم را تا حد قابل قبولی بهبود خواهد بخشید. همچنین در این تحقیق میزان تأثیر استفاده از شباهت های طولی، ترجمه تحت اللفظی و نقش دستوری کلمات، به صورت مستقل یا ترکیبی، برای عملیات ترازبندی مورد بررسی قرار گرفته است. بکارگیری طبقه بندهای سلسله مراتبی در تشخیص نوع تراز بندی به عنوان یکی از شاخص های اصلی سیستم پیشنهادی محسوب می شود که موجب بالا رفتن دقت وسرعت عملیات تولید پیکره نسبت به سایر مدل ها می شود. از ویژگی های دیگر این روش، قابلیت توسعه پذیری آن است. به این ترتیب که می توان با گنجاندن خصوصیاتی (در بدنه بردارهای ورودی) که ممکن است در آینده برای تشخیص بهتر نوع تراز بندی مورد توجه قرار گیرند کیفیت سیستم ترازبندی را ارتقاء بخشید. با این حال، چالش اساسی این رهیافت و بسیاری از روش های پیشین، وجود سلایق متنوع در ترجمه متون است. این مسئله در برخی موارد موجب تولید جملاتی می گردد که مشابهت آن ها با متن اصلی در حد معنا بوده و تنها قابل درک و تشخیص برای انسان می باشد. در چنین وضعیتی کار استخراج جفت عبارات معادل، بسیار دشوار است. علاوه براین در مورد متونی که مقید به رعایت ساختار دستوری زبان فارسی و انگلیسی نمی باشند عملیات تشخیص جملات هم تراز ممکن است به خوبی انجام نپذیرد.

خوشه بندی شبه ناظر مقید در شبکه های خود سازمانده پویا
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391
  امین الله یار   هادی صدوقی یزدی

الگوریتم های شبه ناظر به علت دقت پایین خوشه بندها و همچنین هزین? بالای طبقه بندها معرفی گردید. اینالگوریتم ها با استفاد? توام از داده های برچسب دار و بدون برچسب سعی می کنند دقت یادگیری را افزایش دهند. برای فرآهم آوردن سهولت بیشتر برای کاربر که منبع اصلی دریافت اطلاعات است، الگوریتم های شبه ناظر مقید ارائه گردید. این الگوریتم ها به جای استفاده از برچسب داده ها، از قیود متصل به آن ها در فرآیند یادگیری استفاده می کنند.در مطالعات بسیاری نشان داده شده است که اهمیت داده ها برای مقید شدن یکسان نمی باشد. به عبارت دیگر در صورتی که داده های مناسبی جهت مقید شدن انتخاب شود، می توان با تعداد قیود کمتر به دقت بیشتری دست یافت. در این پایان نامه به عنوان بند اول الگوریتم پیشنهادی، روشی جهت انتخاب داده های مناسب برای مقید شدن ارائه می گردد. از طرف دیگر معمولا مسائل دنیای واقعی دارای تعداد داده های بسیار زیادی هستند. با وجود این خصوصیت، الگوریتم های معمولی برای اجرا نیازمند هزین? محاسباتی و حافظ? زیادی خواهند بود. برای این گونه مسائل،الگوریتم های یادگیری برخط مورد استفاده قرار می گیرد. متاسفانه مطالعات کمی در مورد الگوریتم های خوشه بندی برخطی که بتوانند داده های مقید را خوشه کنند، صورت پذیرفته است. در این پایان نامه به عنوان بند دوم از الگوریتم پیشنهادی برآنیم تا با استفاده از شبکه های شبه ناظر خودسازمانده پویا به عنوان الگوریتم پایه، روش خوشه بندی ارائه نماییم که علاوه بر آنکه توانایی خوشه بندی داده ها را به صورت برخط داشته باشد، بتواند با استفاده از قیود متصل به داده ها، خوشه هایی متناسب با دانش دامنه ای مسئله ارائه نماید.برای ارزیابی کارایی، ابتدا الگوریتم پیشنهادی به صورت تحلیلی مورد بررسی قرار گرفته و حد بالای خطایی برای آن اثبات می گردد. سپس با کمک آزمایشاتی که بر روی مجموعه داده های مصنوعی، uci و همچنین مجموعه داده های مسئل? ترازبندی جملات انجام گرفته است، کارایی الگوریتم نمایش داده شده است.

طراحی یک سیستم طبقه بند مبتنی بر گوناگونی رفتاری
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391
  محمد مهدی سالخورده حقیقی   عابدین واحدیان مظلوم

در این رساله روشهای جدید ی برای ساخت سیستمهایی با چند طبقه بند ارائه شده است. برای ساخت چنین سیستمهایی روشهایی برای مدلسازی رفتار طبقه بندهای پایه معرفی گردیده اند تا ضمن توجه به گوناگونی این طبقه بندها، با افزایش میزان گوناگونی کارایی سیستم مبتنی برچند طبقه بند تا حد امکان افزایش یابد. وجود گستردگی درکاربردهای طبقه بندی از یک سو و تنوع داده ها از سوی دیگر باعث می شود نتوان از یک طبقه بند جامع با کارایی بالا برای محدوده ای وسیع از کاربردها استفاده نمود. بنابراین ضرورت بکارگیری سیستمهایی با چند طبقه بند به چند دلیل احساس می شود از جمله استفاده از طبقه بندهای ساده بجای یک طبقه بند پیچیده، پوشش دهی بهتر فضای ورودی، افزایش قابلیت اطمینان تصمیم گیری، و کاهش ریسک انتخاب طبقه بند نادرست. در تحقیقات انجام شده در این رساله برای ساخت سیستمی با چند طبقه بند سه گام اساسی درنظر گرفته شده است. در گام اول مدل سازی رفتار طبقه بندهای پایه مورد توجه است. برای این منظور ابزارهایی معرفی می شوند که به شکل مناسبی مدل سازی رفتار طبقه بندها را انجام دهند. با توجه به اینکه طبقه بندهای پایه در این تحقیقات شبکه ی عصبی چند لایه هستند، به عنوان یکی از ابزارها ی مدل سازی، الگوی تصمیم چندلایه(edt) معرفی می گردد. این ابزار رفتار لایه های داخلی طبقه بندهای پایه را مدل سازی می نماید. ابزار دیگری که برای مدل سازی رفتار طبقه بندهای پایه معرفی گردیده، بر توصیف داده با بردار پشتیبان مبتنی است. این ابزار که الگوی تصمیم مبتنی بر بردار پشتیبان (svdt) نام دارد مدل رفتار طبقه بندها را با استفاده از ساخت svdd در خروجی طبقه بندهای پایه انجام می دهد. این ابزارها در مراحل بعدی ساخت سیستمی با چند طبقه بند استفاده می شوند. گام دوم در راه ایجاد سیستمی با چند طبقه بند توجه به گوناگونی طبقه بندهای پایه است. واضح است که از ترکیب چند طبقه بند مشابه نمی توان انتظار بهبود قابل توجه در کارایی را داشت. در نتیجه لازم است در فرایند ساخت چنین سیستمهایی تا حد امکان گوناگونی بین طبقه بندها افزایش یابد. از طرف دیگر تقابل آن با کارایی سیستم ایجاب می نماید تعادلی بین کارایی و گوناگونی ایجاد گردد. در نتیجه در گام دوم دو روش برای ایجاد گوناگونی معرفی می گردد. در روش اول گوناگونی با تغییر وزنهای طبقه بندهای پایه بر مبنای معیار گوناگونی تعریف شده با استفاده از confusion matrix ایجاد می گردد. روش دوم، از ابزار svdt و معیار گوناگونی تعریف شده بر مبنای آن استفاده می نماید که فاصله ی svdd های ساخته شده در خروجی طبقه بندهای پایه را ملاک قرار می دهد. در همه ی این روشها افزایش گوناگونی با اختصاص دادن هر طبقه بند به یکی از کلاسهای داده ی ورودی انجام می شود. در گام سوم ساخت سیستم چند طبقه بند با استفاده از ابزارها و روشهای ایجاد گوناگونی معرفی شده است. برای این منظور نیاز به روشهای ترکیبی است که با روشها و ابزارهای معرفی شده در گامهای اول و دوم سازگار باشند. در نتیجه روش ترکیب مبتنی بر svdd بر مبنای معیار گوناگونی تعریف شده با استفاده از آن ایجاد شده است. چند روش ترکیب دیگر نیز در این گام معرفی شده است. در ضمن معرفی روشها و ابزارهای لازم برای ساخت سیستمهایی با چند طبقه بند، روشهایی نیز برای نمایش کارایی آنها ارائه می گردد. همچنین از مجموعه داده های استانداردی نیز برای ارزیابی روشها استفاده شده است.

وفقی کردن عرض کرنل و تنک سازی برخط در شبکه عصبی حداقل میانگین مربعات مبتنی بر کرنل
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391
  زهرا خندان خادم الرضا   هادی صدوقی یزدی

یادگیری را می توان به دو دسته کلی یادگیری دسته ای و یادگیری برخط تقسیم کرد. یادگیری برخط معمولا در مسائلی که کلیه داده ها موجود نباشد و به پاسخی مناسب در زمانی کم نیاز باشد، کاربرد دارد. روش های مختلفی برای یادگیری برخط ارائه شده است که هر یک سعی دارند تا به بهترین جواب برسند. اما هنگامی که داده ها ساختاری غیرخطی و نامحدب داشته باشند، روش های کلاسیک یادگیری قادر به افراز صحیح داده ها نمی باشند. یادگیری مبتنی بر کرنل، یک راه حل مناسب برای چنین مسائلی می باشد. اما مشکلاتی که این روش ها با آن درگیرند، نیاز به تنظیم مناسب پارامترهای به کار رفته در کرنل مربوطه و وابستگی مرتبه پیچیدگی مسئله با تعداد نمونه ها می باشد. در این پایان نامه، سعی شده است تا در ابتدا، مسئله انتخاب بهترین پارامتر کرنل (که در اینجا پارامتر عرض کرنل گوسی می باشد)، به روشی برخط و به منظور کاهش خطا، در شبکه عصبی حداقل میانگین مربعات (خطا) مبتنی بر کرنل ارائه و حل شود. سپس از معیاری کارا، درجهت ممانعت از رشد پیچیدگی منطبق بر داده ها، استفاده شده تا این روش مبتنی بر کرنل، به معنای واقعی به روشی کارا و برخط تبدیل شود. نتایج آزمایش ها روی مجموعه داده های واقعی و مصنوعی نشان از برتری روش پیشنهادی دارند.

تلفیق توصیفگر داده ماشین بردار پشتیبان یک کلاسی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده فنی 1391
  نشاط صالحی   هادی صدوقی یزدی

توصیف گر داده مبتنی بر بردار پشتیبان (svdd)، یکطبقه بندبا ناظرتک کلاسهاست. هدف این طبقه بندمرزی، بهینه کردن حجم دایره (ابرکره) اطراف مجموعه هدف خطی یا غیرخطی می باشد. حداقل پیچیدگی زمانیاینگونه طبقه بندها، است؛ در نتیجه با افزایش تعداد نمونه ها، مسئله برای مجموعه داده های حجیم کارایی خود را از دست می دهد. هدف اصلی این پایان نامه، توسعه svdd، به منظور ایجاد امکان استفاده از آن در کاربردهای حجیم وافزایش سرعت بدون کاهش کارایی یادگیری در توصیف داده ها است. این هدف، با بهره گیری از روش های تلفیق طبقه بندها به منظور افزایش سرعت یادگیری و کاهش نسبی میزان خطا در توصیف داده ها برآورده شده است؛که نتیجه ی آن تلفیق طبقه بندها با وزن دهی مبتنی بر کارایی آن ها می باشد. در بند اول روش پیشنهادی،طبقه بند svdd،ابتدا با روش adaboostترکیب گردیدهو سپس در بند دوم،ضرایب لاگرانژ طبقه بند svdd، با استفاده از روش تخمین مبتنی بر بیشینه کردن امیدریاضی(em)، محاسبه شدهاست که نتیجه ی آندو نوع طبقه بند ترکیبی همگرااست. دو روش پیشنهادیاز نظر سرعت و دقت با سایر الگوریتم های تک کلاسه svdd مبتنی بر کرنل از جمله fsvdd و طبقه بند افزایشی (inc-svdd)و جعبه ابزار libsvm-svddبر روی مجموعه داده های استاندارد uciو مجموعه داده idsآزمایش و مقایسه شده اند. نتایج حاصل، برتری روش های پیشنهادی را از نظرکارایی و سرعت در مرحله آموزش و تستنشان می دهد.

طبقه بندی مبتنی بر جاذبه
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی کامپیوتر 1391
  شفیق پارسازاد   هادی صدوقی یزدی

طبقه بندی و ارتباط، شایع ترین مسائل در داده کاوی برای استخراج دانش، یادگیری ماشین، تخمین ، دسته بندی و ابزار مهمی برای برآورد و پیش بینی هستند. هدف طبقه‎بندی داده‎ها، سازماندهی و تخصیص داده‎ها به کلاس‎‎های مجزا می‎باشد. در این فرآیند بر اساس داده‎های توزیع شده، مدل اولیه‎ای آموزش داده می‎شود و سپس این مدل برای پیشگویی کلاس داده‎ی جدید مورد استفاده قرار می گیرد. در این پایان نامه مدل جدیدی برای طبقه بندی داده ها با الهام گرفتن از قانون انرژی پتانسیل گرانشی در بین ذرات به نام "طبقه بندی مبتنی بر جاذبه" ارایه شده است. مبنای اصلی در این طبقه بند یافتن مکان تعادل برای جداساز می باشد. در روش پیشنهادی داده ها به صورت ذرات دارای جرم و ثابت، که بر اساس قانون جهانی گرانش نیوتن با یکدیگر در تعامل هستند، مدل شده اند. انرژی پتانسیل، نوعی انرژی ذخیره شده است. انرژی پتانسیل، اثری سیستمی است و برای جسمی کاملاً منزوی وجود ندارد. جسم به اعتبار کمیت مکانی اش نسبت به سایر اجسامی که بر آن نیرو وارد می کنند و یا به دلیل موقعیت مکانی اش در میدانی که بر آن نیرو وارد می کنند، دارای انرژی پتانسیل است. هیچ جسم منفردی انرژی پتانسیل ندارد. همه اجسامی که برهمکنش متقابل دارند، به طور جمعی انرژی ذخیره می کنند.در مدل مطرح شده، پیکربندی پایدار وضعیتی می باشد که انرژی پتانسیل گرانشی حداقل باشد. بنابراین برای حل این مسأله بایستی انرژی پتانسیل گرانشی طبقه بند را معین و سعی در کمینه کردن آن نماییم. برای ارزیابی کارایی، ابتدا الگوریتم پیشنهادی به صورت تحلیلی مورد بررسی قرار گرفته و رسیدن به جواب بهینه سراسری برای آن اثبات شده است. سپس از دیدگاه های مختلف، ساختار و جایگاه آن مورد بررسی قرار گرفته است. در نهایت با کمک آزمایشاتی که بر روی مجموعه داده های مصنوعی، uci و هم چنین مجموعه داده های پزشکی در زمینه تشخیص سرطان انجام گرفته، کارایی الگوریتم نمایش داده شده است. این روش از قابلیت استفاده برای داده های نویزی، داده های با توزیع نامتوازن و داده هایی که اهمیت متفاوتی دارند، برخوردار می باشد. در بخش پایانی ضمن بررسی نقاط ضعف و قوت این روش، راه کارهایی برای بهبود عملکرد الگوریتم از جمله استفاده در کاربردهای برخط ارایه شده است.

طبقه بندی مبتنی بر ترکیب ساختاری وزن دار فاصله ها
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391
  جواد حمیدزاده   رضا منصفی

کمبود داده های آموزشی یکی از مشکلات بارز روش های طبقه بندی غیرپارامتری جهت تخمین پارامترها است. با افزایش ابعاد داده ها نیاز به داده ها به صورت نمایی رشد می نماید. از طرفی با افزایش داده ها 1) نیاز به حافظه بیش تر جهت نگهداری داده ها و 2) افزایش زمان لازم جهت طبقه بندی داده ها احساس می شود. در روش های فوق همواره بین فضای حافظه و نرخ صحت طبقه بندها مصالحه وجود دارد. از طرفی تابع چگالی در نقاط مرزی بین کلاس ها ثابت نیست. تحقیق در زمینه طبقه بندی غیرپارامتری، هم چنان موضوعی چالش بر انگیز است. یکی از روش های معمول طبقه بندی، روش بیز می باشد. در روش بیز ممکن است توزیع ثابت سراسری برای داده ها صادق نبوده و یا این که داده ها در نقاط مختلف از توزیع متفاوتی پیروی نمایند. برای رفع این مشکل می توان از جنبه محلی بودن روش پیشنهادی سود جست. هدف، ارایه مدلی مبتنی بر ویژگی های محلی و سراسری جهت طبقه بندی داده ها به صورت کارآمد است. روش فوق از دو جنبه سراسری و محلی به داده ها اهمیت می دهد، به طوری که جنبه سراسری سعی در کاهش داده های آموزشی (فضای حافظه) و جنبه محلی سعی در غلبه بر عدم تبعیت داده های واقعی از مدل توزیع یکتای سراسری دارد. نوآوری تحقیق حاضر استفاده از ترکیب فاصله ها تا نمونه های آموزشی کلاس ها و ایجاد سطح تصمیم می باشد. دید محلی و سراسری در داده های آموزشی توسط ترکیب این دو لحاظ شده است. از خصوصیات روش پیشنهادی، سادگی طبقه بند است که بدون آموزش و یا با افزودن آموزش مقیاس پذیر به آن می توان طبقه بندی کارآمد ارائه نمود. از اهداف نظری این تحقیق 1) تعیین میزان تعمیم پذیری طبقه بند پیشنهادی و هم چنین 2) تعیین کران بالای امید ریاضی خطا در حالت های مجانبی است. از معیار پیچیدگی rademacher در تعیین کران بالای امید ریاضی خطای طبقه بند پیشنهادی استفاده شده است. برای ارزیابی کارایی روش پیشنهادی، با الگوریتم های مرزهای دانش مانند dwknn، pnnr، lms و kdf-knn بر روی مجموعه داده های استانداردuci مقایسه شده است. در ارزیابی فوق جهت پیاده سازی از محیط های matlab2010 و gams استفاده شده است. از 10-fold cross validation برای تعیین نرخ صحت روش پیشنهادی، استفاده گردیده است. برای سنجش نتایج ارزیابی ها به صورت آماری از روش آزمون فرضیه و آزمون بازه ای با درجه اطمینان 95% کمک گرفته شده است.

توصیه گر موسیقی مبتنی بر یادگیری شبه ناظر برخط
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391
  فرج الله منصوری   هادی صدوقی یزدی

امروزه یکی از کاربرد های مهم شبکه جهانی اینترنت خرید و فروش می باشد. کاربران به دلایل مختلف از قبیل تجارت، انتقال اعتبار، خرید مایحتاج زندگی و یا تفریح ممکن است از این بستر استفاده نمایند. در بخش تفریحی، روزانه میلیون ها دلار فیلم، موسیقی و یا عکس در وب سایت های مختلف به فروش می رسد. معمولا مشتریان با جستجو در این وب سایت ها کالاهای مورد نظر خود را یافته و خریداری می نمایند. به تازگی این وب سایت ها جهت ایجاد راحتی بیشتر برای کاربر و به طبع آن افزایش فروش خود به ایجاد سیستم هایی روی آورده اند که بتوانند کالاهایی که احتمال بیشتری دارد که کاربر آن ها را خریداری نماید را بر اساس شواهد موجود در مورد نظرات و یا علایق کاربر مشخص نموده و به کاربر پیشنهاد دهند. به چنین سیستم هایی سیستم های توصیه گر گفته می شود. تاکنون برای تشخیص اولویت های کاربر در سیستم های توصیه گر موسیقی، از طبقه بند های متعددی از قبیل شبکه های بیزین، شبکه های rbf و بردار های پشتیبان استفاده شده و نتایج مناسبی نیز گزارش گردیده است. اما جهت آموزش این طبقه بند ها، باید کلی? داده ها برچسب داشته باشند. به عبارت دیگر کاربر باید کلی? آهنگ های موجود در مجموع? یادگیر را شنیده و نظر خود را اعلام نماید. علاوه بر آن، مسئله ای که تاکنون کمتر مورد توجه قرار گرفته است آن است که نظر و اولویت های کاربر بر اساس حالت و وضعیت روانی او (از قبیل عصبانیت، شادی و یا غم) تغییر می نماید و لازم است که سیستم خود را با این تغییرات وفق دهد. اما طبقه بندهای پیشنهاد شده تاکنون، قابلیت تغییر مفهوم را پشتیبانی نمی نمایند و با تغییر نظر کاربر باید مجدداً آموزش ببینند. اگرچه استفاده از طبقه بندهای برخط می تواند تا حدودی مشکل را حل نمایند، اما به علت نیاز به زمان برای همگرا شدن و همچنین نیاز به برچسب گذاری مجدد کلیه داده ها (براساس نظرات جدید کاربر)، عملاً نمی توان از آن ها استفاده نمود. در این پایان نامه برآنیم که سیستم توصیه گر موسیقی برای انتخاب آهنگ های مورد علاق? کاربر براساس تعدادی از آهنگ های مورد علاق? قبلی او طراحی نماییم که علاوه بر آنکه تغییر مفهوم را پشتیبانی کند، نیاز به آموزش مجدد (که هزین? زیادی دارد) نداشته باشد. همچنین بتواند با تعداد داده های برچسب دار کمی آموزش داده شود. در نهایت دقت الگوریتم ارائه شده را بر روی تعدادی از مجموعه داده های uci و همچنین مجموعه داد? واقعی music recommendation توسط تعدادی از متداول ترین معیار های یادگیری ماشین شامل: f-measure، precision، recall و robustness analysis بررسی و دقت بدست آمده را با الگوریتم های رقیب که برای حل هر زیر مشکل ارائه گردیده اند مقایسه خواهیم نمود.

طبقه بندی خطی داده های جداناپذیر خطی با مستثنی سازی قیود
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1392
  حسن عباسی   رضا منصفی

معیارهای مختلفی برای ارزیابی طبقه بندها وجود دارد که از آن جمله می توان به صحت، دقت، سادگی، تعمیم پذیری، تفسیرپذیری، تعداد پارامترها و نحوه ی تنظیم آن ها اشاره نمود. طبقه بندهای خطی، ساده، تعمیم پذیر، تفسیرپذیر و دارای تعداد پارامتر کم هستند. اما اغلب مسائل طبقه بندی دنیای واقعی دارای الگوهای جداناپذیر خطی است. برای این که طبقه بند خطی بتواند داده های جداناپذیر خطی را نیز درست طبقه بندی کند، یک راه حل، تبدیل داده ها به کمک توابع کرنل و راه حل دیگر ترکیب طبقه بندهای ساده است. از جمله ی روش های ترکیب، می توان به طبقه بندهای خطی محلی و روش های boosting اشاره کرد. یکی از نکاتی که در ترکیب طبقه بندها باید رعایت شود این است که هر چقدر طبقه بندهای پایه ی تشکیل دهنده ی طبقه بند نهایی، ساده تر باشند و توزیع داده ها در آن ها نامتوازن تر باشد، طبقه بند حاصل بهتر عمل می کند. نوآوری این تحقیق، ارائه یک کران بالای خطا برای روش های مبتنی بر ترکیب طبقه بندها است که وابسته به پیچیدگی طبقه بندهای پایه و تعداد موثر آن ها است. بر اساس این معیارها، مدلی جدید برای طبقه بندی غیرخطی، پیشنهاد می گردد که شامل 3 مرحله ی تقسیم، مدل سازی و ترکیب است. الگوها در مرحله ی «تقسیم»، به دو یا چند بخش تقسیم می شود با این هدف که علاوه بر کاهش پیچیدگی موجود در آن ها، توزیع داده ها در آن ها نیز نامتوازن تر شود. مثلاً مشخصاً در اثر تقسیم، بخش بزرگی از داده ها جداپذیرخطی شود. در مرحله ی «مدل سازی»، مدلی برای توصیف هر بخش ارائه می گردد. در مرحله ی فوق، از روش های طبقه بندی خطی، روش های توصیف داده ها وطبقه بندهای تک کلاسه استفاده می شود. در مرحله ی «ترکیب»، طبقه بندهای خطی و مدل های ساخته شده برای هر بخش با یکدیگر ترکیب شده و طبقه بند نهایی را تشکیل می دهند. با انتخاب روش های مختلف تقسیم، مدل سازی و ترکیب، طبقه بندهای نمونه ای به نام های constraint embedded classifier(cec)، recursive cec(rcec) و cluster linear decision tree (cldt) ساخته شده است. سپس امید ریاضی کران بالای خطای آزمون مدل با معیار پیچیدگی rademacher و گاوسی محاسبه شده است. سازگاری و هم گرایی مدل نیز اثبات شده است. عمل کرد الگوریتم های ارائه شده با روش های طبقه بندی متداول مانند svm، k-nn، cart و adaboost روی مجموعه داده های دنیای واقعی مقایسه گردیده است. انجام آزمون های آماری روی نتایج مقایسه، برتری متوسط مدل نسبت به روش های دیگر را نشان می دهد. در نهایت تحلیل اثر انتخاب طبقه بند خطی پایه و هم چنین تحلیل نویز انجام شده است.

فیلتر ذره ای با مدل مشاهده مبتنی بر فیلتر وفقی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391
  حمیده حایری   هادی صدوقی یزدی

هرچند که فیلتر ذره ای (particle filter) ابزاری موثر در ردیابی شیء می باشد، اما یکی از محدودیت های موجود، نیاز به وجود مدلی دقیق برای حالت سیستم و مشاهدات است. بنابراین یکی از زمینه های مورد علاقه محققین تخمین تابع مشاهده با توجه به داده های یادگیری است. تابع مشاهده ممکن است خطی یا غیرخطی در نظر گرفته شود. روش های موجود در تخمین تابع مشاهده با مشکلاتی مواجه هستند. از جمله این مشکلات، وابستگی به مقدار اولیه پارامترها در روش های دومرحله ای مبتنی بر expectation maximization (em) و نیازمندی به یک سری مدل از پیش تعریف شده در روش های مبتنی بر چند مدل می باشد. در این پایان نامه برای اولین بار از فیلترهای وفقی (klms) kernel least mean square و (krls) kernel recursive least square برای تخمین تابع غیرخطی مشاهده استفاده شده است. با فرض معلوم بودن تابع فرآیند و با داشتن دنباله ای از مشاهدات تا زمان فعلی، تابع مشاهده مجهول تخمین زده شده است. در ادامه برای کاهش هزینه محاسباتی و افزایش سرعت اجرا، از روش تُنُک سازی داده ها با استفاده از روش وابستگی خطی تقریبی استفاده شده است. الگوریتم پیشنهادی در دو کاربرد مورد ارزیابی قرار گرفته است. آزمایش اول بر مدل های سری زمانی و دیگری روی ردیابی شی ویدئویی اعمال شده است. در انتها مقایسه نتایج نشان می دهد که نتایج الگوریتم پیشنهادی ، به نتایج حالتی که در آن تابع مشاهدات معلوم در نظر گرفته می شود، همگرا خواهد شد.

نهان کاوی کور ویدئو با رویکرد یادگیری شبه ناظر برای الگوریتم های نهان نگاری ویدئوی مبتنی بر بردارهای حرکت
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1392
  جواد مرتضوی مهریزی   مرتضی خادمی

با رشد الگوریتم های نهان نگاری ویدئو، نهان کاوی کور ویدئو هم مورد توجه قرار گرفته و پژوهش هایی در این زمینه انجام شده است. نهان کاوی کور ویدئو، هنر و علم پی بردن به حضور پیام سری در درون یک ویدئوی میزبان است در حالی که هیچ اطلاعاتی از الگوریتم نهان نگاری مورد استفاده وجود ندارد. الگوریتم های که تا این زمان در زمینه نهان کاوی کور ویدئو ارائه شده است منطبق بر یادگیری با ناظر بوده و کاملاً برون خطی (offline) هستند. حال آنکه بدست آوردن برچسب داده ها در الگوریتم های یادگیری با ناظر (به خصوص در فرآیند نهان کاوی کور) هزینه بر بوده و نیاز به کار انسانی زیادی دارد. از طرف دیگر با استفاده از الگوریتم های یادگیری برون خطی، امکان استفاده از مجموعه داده آموزشی بزرگ (که در فرآیند نهان کاوی کور مطلوب است) و داده های جدید در آموزش سیستم وجود نخواهد داشت. در این پایان نامه یک الگوریتم نهان کاوی کور ویدئو با رویکرد یادگیری شبه ناظر پیشنهاد شده است که در آن هدف حمله به الگوریتم های نهان نگاری ویدئوی مبتنی بر بردارهای حرکت می باشد. نتایج شبیه سازی نشان می دهند علاوه بر اینکه روش پیشنهادی دارای دقت آشکارسازی مناسب است می تواند با استفاده از یادگیری شبه ناظر هزینه مرحله آموزش را از نظر تولید داده برچسب دار کاهش دهد. از طرف دیگر روش پیشنهادی کاملاً برخط (online) است، در نتیجه امکان استفاده از مجموعه داده های آموزشی بزرگ برای آموزش سیستم فراهم می شود به طوریکه مدت زمان لازم برای آموزش سیستم نسبت به روش های مرسوم تا 50 درصد کاهش می یابد. علاوه بر این روش پیشنهادی می تواند به صورت برخط و بدون نیاز به هیچ هزینه اضافی، سیستم را به ازاء یک ورودی جدید بروز کند که در فرآیند نهان کاوی کور ویدئو بسیار مناسب است.

مقایسه دقت پیش بینی درماندگی مالی شرکت ها با روش ماشین بردار پشتیبان بازه ای و ماشین بردار پشتیبان استاندارد
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده علوم اداری و اقتصاد 1392
  حمید رمضانی   مهدی مرادی

معمولاً سرمایه گذاران و سایر گروه های ذی نفع، از اطلاعات مالی برای تصمیم گیری استفاده می کنند. از آنجا که اتخاذ تصمیم نادرست، منجر به درماندگی مالی و ورشکستگی شرکت ها شده و علاوه بر تحمیل هزینه های سنگین اقتصادی و اجتماعی، مشکلات جبران ناپذیر اقتصادی را به همراه دارد، لذا پیش بینی وضعیت مالی شرکت ها همواره مورد توجه سرمایه گذاران، اعتباردهندگان، دولت و پژوهشگران مالی بوده است. در مطالعات مالی میزان اتکاپذیری داده های ورودی مدل (متغیر مستقل) در سطح بالا لحاظ می شود لذا در این تحقیق موضوع عدم قطعیت داده ورودی به مدل ماشین بردار پشتیبان مورد توجه قرار گرفته و با استفاده از مفهوم داده ی بازه ای، مدل جدیدی طراحی شده است. به منظور آزمون مدل پیشنهادی، نمونه تحقیق شامل30 زوج شرکت درمانده و سالم در بازه زمانی سال های 1380 تا 1390 انتخاب و 40 نسبت مالی به عنوان متغیرهای مستقل درنظر گرفته شدند. نتایج تحقیق نشان می دهد در طول بازه های مختلف (به استثناء بازه 30/0) عملکرد مدل بازه ای نسبت به مدل استاندارد مطلوب تر می باشد و مدل پیشنهادی تحقیق در قبال تغییر طول بازه انعطاف پذیر است. در واقع با وجود کاهش قطعیت داده ی ورودی، مدل همچنان قادر به پیش بینی صحیح وضعیت مالی آتی شرکت می باشد.

طبقه بندی برخط داده های جریانی غیرایستان و نامتعادل با رویکرد وزن دهی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1392
  عادل قاضی خانی   رضا منصفی

طبقه بندی داده های جریانی غیرایستان یکی از شاخه های مهم علم تشخیص الگو و یادگیری ماشین است که به طور روز افزون مورد توجه قرار گرفته است. دلیل این موضوع کاربردهای فراوان جدیدی از قبیل کارت های اعتباری، آب و هوا، شبکه های حس گر بی سیم، داده های وب و غیره است. در طبقه بندی داده های جریانی چالش اساسی تغییر مفهوم (غیرایستان بودن) است، که در آن تابع توزیع زیرین توصیف کننده داده ها به مرور زمان تغییر می کند. یکی از چالش های دیگری که در طبقه بندی داده های جریانی وجود دارد کلاس های نامتعادل است. کلاس های نامتعادل چالشی برای بیش تر طبقه بندهای باناظر است که در آن تعداد نمونه ها در کلاس های مختلف با یکدیگر اختلاف فاحش دارند. اغلب الگوریتم هایی که تاکنون برای طبقه بندی داده های جریانی غیرایستان و نامتعادل ارائه شده اند رویکرد دسته ای دارند. از این رو، برخلاف مطالعات قبلی، در این پایان نامه طبقه بندهایی برخط برای طبقه بندی داده های جریانی غیرایستان و نامتعادل پیشنهاد شده است. در این راستا، الگوریتم هایی در سه دسته اساسی مبتنی بر فیلترهای وفقی، پرسپترون و ترکیب برخط طبقه بندها ارائه شده است. در الگوریتم های مبتنی بر فیلتر وفقی و پرسپترون رویکرد اساسی وزن دهی به خطا و در الگوریتم های مبتنی بر ترکیب برخط طبقه بندها رویکرد اساسی وزن دهی به رأی طبقه بندهای پایه است. در الگوریتم های مبتنی بر فیلترهای وفقی از تئوری ردیابی و تئوری کالمن و در الگوریتم های مبتنی بر پرسپترون و ترکیب برخط طبقه بندها از مدل کران خطا برای تحلیل الگوریتم ها استفاده شده است. برای ارزیابی الگوریتم ها از مجموعه داده های متنوع واقعی و مصنوعی مورد استفاده در تحقیقات پیشین، بهره برده شده است. در ارزیابی الگوریتم ها از معیارهای میانگین هندسی، نرخ صحت مثبت و منفی (tpr,tnr)، f-measure و هم چنین مرتبه زمانی و مکانی استفاده شده است. برای تأیید نتایج آزمایش ها از آزمون های تمایز آماری anova و hsd استفاده شده است. نتایج آزمون های تمایز آماری نشان دهنده برتری الگوریتم های پیشنهادی مبتنی بر فیلترهای وفقی نسبت به rlsp,rbsop,lbsop,rbp,lbp، الگوریتم های پیشنهادی مبتنی بر پرسپترون نسبت به spa,sop,lbsop,rbsop و الگوریتم های پیشنهادی مبتنی بر ترکیب برخط طبقه بندها نسبت به oe1,oe2,onb دارد.

ارائه ی یک روش انتشار اعتماد مقیاس پذیر مبتنی بر گروه بندی برای شبکه ی اعتماد
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1392
  فاطمه رحمن عیسی   عباس قائمی بافقی

امروزه با گسترش ارتباطات و رشد روزافزون حجم شبکه¬های تعاملی، بسیاری از روش¬های متداول انتشار اعتماد ارائه شده از مقیاس¬پذیری، کارایی و دقت لازم برخوردار نیستند. در این پایان¬نامه با استفاده¬ی مشابه از مفهوم اعتماد در جامعه، که در آن اعتماد می¬تواند در سطوح مختلف فرد، گروه و جامعه منتشر شود، روش انتشار اعتماد مبتنی بر گروه¬بندی با استفاده از مفهوم اطمینان، پیشنهاد شده است. در این روش پیشنهادی، انتشار اعتماد مشابه سیستم¬های مدیریت اعتماد متداول انجام نمی¬شود بلکه از اطلاعات عضویت عامل¬ها برای محاسبه¬ی اعتماد استفاده می-شود. به صورت تحلیلی و آزمایشی نشان داده شده است که مقیاس¬پذیری، کارایی و دقت انتشار اعتماد در این روش بهبود یافته است. برای ارزیابی روش ارائه شده، از مجموعه¬¬ داده¬¬¬ی واقعی advogato.org استفاده شده است. ارزیابی میزان خطا با استفاده از میانگین قدر مطلق خطا و میزان همبستگی صورت گرفته است. نتایج مقایسه¬ی روش پیشنهادی با روش پایه¬ی انتشار اعتماد ims بیانگر آن است که میزان همبستگی افزایش و میزان خطا کاهش یافته است.

طبقه بندی مقاوم با احتیاط داده های توام با عدم قطعیت
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  یحیی فرقانی   هادی صدوقی یزدی

مدل طبقه بندی مقاوم، یک مدل غیراستاندارد برای یادگیری طبقه بند براساس یک مجموعه داده توام با عدم قطعیت است. یک هدف این رساله کاهش زمان آزمون این مدل همراه با کاهش زمان آموزش یا بدون افزایش چشمگیر زمان آموزش است. برای این منظور، نخست دوگان مدل طبقه بندی مقاوم به ازای انواع خاصی از مجموعه های عدم قطعیت تعیین می شود. متاسفانه بردار وزن و بایاس طبقه بند بهینه مستقیما از حل مدل دوگان به دست نمی آید. لذا، در مرحله بعد، به کمک شرایط لازم بهینگی، بردار وزن و بایاس ابرصفحه طبقه بند بهینه براساس جواب بهینه مدل دوگان تعیین می گردد. سپس ثابت می شود که این بردار وزن را می توان به صورت ترکیب خطی داده های آموزشی نوشت و تنک بودن این ترکیب خطی که ارتباط مستقیمی با زمان آزمون دارد تضمین شده است. در ادامه، نشان داده می شود که مدل های طبقه بندی مقاومی که تاکنون معرفی شده اند مدل های طبقه بندی بی احتیاط هستند. جواب بهینه یک مدل طبقه بندی مقاوم بی احتیاط به ازای یک مجموعه داده آموزشی، ممکن است ابرصفحه نباشد که در این صورت امکان طبقه بندی داده ها در مرحله آزمون میسر نخواهد بود. لذا، مدل طبقه بندی مقاوم با احتیاط ارائه می شود و نوع خاصی از آن به یک مدل استاندارد تبدیل می شود. ابرصفحه بودن جواب بهینه مدل طبقه بندی مقاوم با احتیاط تضمین می شود. مشکل مدل های با احتیاط پیشنهادی، زمان آموزش و زمان آزمون زیاد آن است. لذا برای غلبه بر این مشکل، یک مدل طبقه بندی تکه ای پیشنهاد می شود که هر تکه از طبقه بند آموزش یافته توسط این مدل، حاصل اجرای یک مدل طبقه بندی مقاوم با احتیاط به ازای یک زیرمجموعه از داده های آموزشی حاصل از افراز داده های آموزشی است. زمان آموزش و زمان آزمون مدل تکه ای، تقریبا به ترتیب، رابطه عکس و رابطه مستقیمی با تعداد زیرمجموعه داده های حاصل از افراز داده ها دارد. ثابت می شود که درحالت خاص، این مدل تکه ای به یک مدل نزدیکترین همسایه مرتبه صفر یا مرتبه یک تبدیل می شود. اجرای مدل نزدیکترین همسایه مرتبه صفر و مرتبه یک به ازای داده های توام با عدم قطعیت، مستلزم حل مدل های ریاضی است. نشان داده می شود که جواب بهینه این مدل های ریاضی به ازای انواع خاصی از مجموعه های عدم قطعیت، به روش تحلیلی به دست می آید و نیازی به حل عددی مدل های ریاضی یادشده و صرف زمان زیاد برای حل آنها نمی باشد. از مدل های پیشنهادی برای کاهش زمان آموزش، زمان آزمون و یا نرخ خطای طبقه بندی به ازای داده های آموزشی ناقص، و برای کاهش زمان آموزش و یا زمان آزمون طبقه بند به ازای داده های آموزشی کامل استفاده می شود. مدل های پیشنهادی با استفاده از مجموعه داده های واقعی با مدل های مقاوم و نامقاوم مقایسه می گردند. برمبنای نتایج به دست آمده از آزمایش ها باید گفت که استفاده از مدل مقاوم با احتیاط پیشنهادی منجر به بهبود 5 درصدی نرخ خطا نسبت به بهترین مدل از مدل های پیشینه تحت آزمایش می شود اگرچه این بهبود در نرخ خطا در ازای افزایش زمان آموزش و زمان آزمون مدل نسبت به مدل های پیشینه تحت آزمایش می باشد. درضمن، زمان آموزش و زمان آزمون مدل دوگان پیشنهادی به ترتیب 0.27 و 0.19 زمان آموزش و زمان آزمون مدل مقاوم بی احتیاط اولیه ای است که در پیشینه ارائه شده است درحالی که نرخ خطای این دو مدل برابر است.

یادگیری ساختار شبکه بیز برای داده های جریانی ایستان
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  امید کیوانی   هادی صدوقی یزدی

شبکه بیز کاربرد زیادی در بسیاری از مسائل دارد و یادگیری ساختار آن مهمترین بخش آن میباشد. برای یادگیری شبکه بیز الگوریتمهای زیادی وجود دارند. اما الگوریتم کارآمد و مفیدی برای یادگیری این ساختار در شرایط جریانی بودن دادهها وجود ندارد. دادههای جریانی دارای فرضیاتی میباشند که به شرایط واقعی بسیار نزدیک است و از این رو بسیار حائز اهمیت هستند. در این پایاننامه ابتدا بررسی روشهای ممکن برای یادگیری ساختار شبکه بیز در صورت جریانی بودن دادهها انجام شده است و سپس الگوریتمی ارائه شده که از لحاظ پیچیدگی زمانی و مکانی با فرضیات دادههای جریانی مطابقت داشته باشد. ضمناَ، از آنجا که فرض شده است دادهها ایستان میباشند، همگرایی و حساس نبودن الگوریتم پیشنهادی به نویز نیز اثبات شده است. آزمایشاتی بر روی چندین داده استاندارد شبکه بیز نیز انجام شده که نتایج این آزمایشات، درستی قضایای همگرایی و حساس نبودن به نویز را تایید میکند. در بخش دوم این پایاننامه کاربرد جدیدی برای شبکه بیز در تلفیق نظر چند طبقه بیز معرفی شده است. برتری استفاده از شبکه بیز نسبت به روشهای سابق که اکثراَ مبتنی بر وزندهی هستند این است که، حتی از طبقهبندهایی که دقت پایین دارند به خوبی استفاده میکند و مانند روشهای وزندهی نیاز نیست تا فرض شود که تمام طبقهبندهای پایه دقتی بیش از 5 % داشته باشند. دو مثال شهودی برای درک بهتر مزیت استفاده از شبکه بیز در تلفیق طبقهبندها بیان شده است. در نهایت این سیستم تلفیقگر برای دادههای جریانی نیز استفاده شده است. برای این منظور از الگوریتم ارائه شده در بخش اول پایاننامه استفاده شده. الگوریتم پیشنهادی بر روی چند داده از مخزن uci و چند داده از دادههای استاندارد شبکه بیز بررسی شده که نتایج بهدست آمده حاکی از این است که استفاده از شبکه بیز برای طبقهبندی باعث بهبود دقت و همچنین قابلیت اطمینان طبقهبند میشود.

طبقه بند چندکلاسی مقیاس پذیرمبتنی بر پیچیدگی داده ها
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  حمید رضا غفاری   هادی صدوقی یزدی

در این رساله، برای طراحی طبقه بند چندکلاسی تعمیم پذیر مقیاس پذیر، بُعد vc در نظر گرفته شده است. این بُعد، ظرفیت مجموعه ای از توابع طبقه بندی را اندازه گیری می کند و در الگوریتم های یادگیری، خطای تعمیم پذیری وابسته به آن می باشد. وجود گستردگی در استفاده از طبقه بند چندکلاسی در کاربردهای جهان حقیقی از یک سو و تعداد زیاد کلاس های این گونه کاربردها از سوی دیگر، سبب شده تا نتوان از طبقه بند ماشین تکی استفاده نمود، زیرا که در طبقه بند ماشین فوق، تمام ابرصفحه های بین کلاس ها با هم به دست می آید. در این گونه روش ها با بهینه سازی مسأله ای بسیار بزرگ و پیچیده مواجهیم که حل آن بسیار زمان بر و بعضاً غیرممکن است. بنابراین، برای حل این گونه از مسائل، از روش های تجزیه استفاده می شود. در این رساله، با بهره گرفتن از مفهوم پیچیدگی داده ها (به عنوان یک عنصر کم تر استفاده شده در تحقیقات گذشته طبقه بند چندکلاسی)، مسأله دنبال شده است تا تعمیم پذیری طبقه-بندهای چندکلاسی مبتنی بر روش های تجزیه بهبود یابد. پیچیدگی داده ها جهت خوشه بندی کلاس ها و تعیین ساختاری مناسب برای طبقه بند بکار رفته، به نحوی که مقدار هزینه برای تابع هدف حداقل و در نتیجه خطای تعمیم پذیری کم شود. بعد از تعیین ساختار مناسب برای طبقه بند (با توجه به ویژگی های مناسب)، صرفاً طبقه بندهای باینری ماشین بردار پشتیبان جهت اخذ نتیجه استفاده گردیده است. در انتخاب روش های طبقه بندی مبتنی بر تجزیه نیز باید توجه نمود که در روش های تجزیه: 1- یکی در برابر دیگری، 2-یکی در برابر بقیه، با مشکلاتی مواجه ایم، در مورد اول، تعداد طبقه بند پایه با تعداد کلاس رشد فزاینده ای دارد و در روش دوم با مشکل عدم موازنه داده ها مواجه ایم. استراتژی تجزیه ای که مشکلات فوق را تا حدی حل می نماید، استراتژی درختی است، اما کماکان مسأله مهم در این جا، چگونگی ساخت درخت است. در استراتژی درختی، روش ماشین بردار پشتیبان با روش درختی ترکیب شده، بدین معنی که حل مسأله از دو قسمت یادگیری بدون ناظر و یادگیری باناظر تشکیل می شود. بخش اول که یادگیری بدون ناظر است، درختی سلسله مراتبی از کلاس ها ساخته می شود که هر کدام از کلاس ها در برگ های درخت قرار می گیرد، در بخش دوم، برای هر گره، طبقه بندی باینری آموزش داده می شود. نهایتاً، دو قسمت مذکور با هم، ساختار طبقه بند چندکلاسی را تشکیل می دهد. در این رساله، تمرکز اصلی بر روی بخش بدون ناظر (بهینه سازی ساختار طبقه بند مورد نیاز برای طبقه بند چندکلاسی) می باشد. بنابراین آنچه که در این رساله دنبال خواهد شد، ارائه روشی است که کاربرد آن در بعضی از روش های متعارف، باعث بهبود کارایی می شود. برای بیان ایده، ابتدا ارتباط بین پیچیدگی داده ها، پیچیدگی مدل و بُعد fat-shattering را مورد بررسی قرار می دهیم، سپس سنجه های مختلف موجود برای اندازه گیری پیچیدگی داده ها بررسی می شوند. در این راستا بدنبال کمیتی متناسب با نوع طبقه بند به کار برده شده هستیم. در ادامه، به کمک سنجه مشخص شده برای پیچیدگی داده ها، ساختار مناسبی را برای طبقه بند تعیین و در انتها ثابت می کنیم که طبقه بند پیشنهادشده دارای حداقل بُعد fat-shattering و در نتیجه دارای تعمیم پذیری خوبی است. در انتها، از مجموعه داده های استانداردی نظیر پایگاه های داده ا ی uci، satlog و هم چنین از مجموعه داده ی ایستگاه هوایی برای ارزیابی روش ها استفاده شده است، نتایج حاصل از آزمایش ها، برتری روش پیشنهادی را بر سایر روش ها بیان می کند.

فیلتر کالمن قیاسی، کاربرد در تخمین همزمان حالت و ورودی سیستم های خطی زمان گسسته
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  محمد علی مجیدی انوری   هادی صدوقی یزدی

فیلتر کالمن یک تخمینگر بهینه¬ی حالت برای سیستم¬هایی است که مدل حالت-مشاهده¬ی آن¬ها به طور دقیق در دسترس هستند. اما اگر مدل حالت-مشاهده¬ی موجود دارای عدم قطعیت ناشناخته باشد (موضوعی که در بسیاری از سیستم¬ها رخ می¬دهد)، فیلتر کالمن در تخمین حالت بهینه عاجز خواهد بود سال-های اخیر تحقیقات گسترده¬ای با هدف ارائه تخمینگر حالت بهینه برای سیستم¬هایی که مدل حالت-مشاهده¬ی آن¬ها دارای ورودی مجهول هستند صورت گرفته است. نتیجه¬ی این تحقیقات، روش¬هایی با عنوان فیلترهای ورودی مجهول هستند که می¬توانند تخمین حالت بهینه را برای برخی از سیستم¬های ورودی مجهول، از دیدگاه تخمینگرهای نا اریب و حداقل واریانس خطا، محاسبه کنند. شرایط این سیستم¬های ورودی مجهول برای ارضای خاصیت نا اریب بودن کاملا در مقالات مشخص شده، ولی برای ارضای خاصیت حداقل بودن واریانس خطا، تا به حال تحقیق جامعی صورت نگرفته است. در این پایان¬نامه ابتدا شرایطی برای سیستم¬های ورودی مجهول بررسی و اثبات می¬شود که در این شرایط، فیلتر¬های ورودی مجهول نمی¬توانند از اطلاعات کواریانس¬های نویز فرایند و مشاهده، به طور کامل استفاده کنند و در نتیجه نمی¬توانند تخمین حداقل واریانس خطا را ارائه دهند، سپس راه کار مناسبی برای حل این مشکل ارائه می¬گردد. در راه کار ارائه شده ورودی مجهول توسط فیلتر وفقی تخمین زده می¬شود و سپس این تخمین توسط فیلتر کالمن برای تخمین حالت سیستم مورد استفاده قرار می¬گیرد. علاوه بر این نشان داده¬ایم که از مقدار تخمین زده شده برای ورودی مجهول می¬توان جهت شناسایی پارامترهای مجهول در ماتریس¬های مدل حالت-مشاهده استفاده کرد، به طوری که تخمین حالت و پارامترهای مجهول بصورت همزمان انجام می¬گیرد.

ماشین یادگر افزایشی با معماری فشرده
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  مجتبی نیری   مجتبی روحانی

شبکه های پیشخور نقش بسیار مهمی در یادگیری ماشین ایفا می کنند. در این بین، شبکه ی پیشخور با یک لایه مخفی به دلیل قابلیت تقریب کلی از اهمیت بسزایی برخوردار است. این شبکه به طور گسترده در مسائل طبقه بندی و رگرسیون مورد استفاده قرار گرفته است. از نظر معماری، این شبکه به سه دسته ی معماری ثابت، معماری افزایشی و معماری کاهشی تقسیم می شود. عدم وجود مشکل حداقل محلی از مزایای شبکه با معماری افزایشی می باشد. از جمله چالش های این شبکه تنظیم بهینه پارامترهای ورودی نود مخفی افزوده شده است که راهکارهای متفاوتی برای این منظور ارائه شده است. در این پایان نامه پارامترهای ورودی نود مخفی افزوده شده با حل یک مسئله ی بهینه سازی درجه دو بدست می آیند. این کار سبب می شود قدر مطلق سینوس زاویه ی بین نود افزوده شده و مانده خطا حداقل گردد و نود افزوده شده حداکثر کارایی ممکن را داشته باشد. با توجه به اینکه تعداد نودهای شبکه کمترین مقدار ممکن خواهد بود، این شبکه، ماشین یادگیر افزایشی با معماری فشرده نامیده می شود. به منظور تنظیم بهینه ی زاویه ی بین نود افزوده شده و خطا در روش پیشنهادی، از نودهای با درجه آزادی بالا استفاده می گردد. علی رغم مزیت های فراوان ماشین یادگیر افزایشی با معماری فشرده، این روش مانند همه ی روش های مبتنی بر حداقل سازی مربعات خطا، در برابر نویز غیرگوسی و داده های پرت،کارایی مناسبی نخواهد داشت. بنابراین ماشین یادگیر افزایشی با معماری فشرده مبتنی بر آنتروپی و کورآنتروپی ارائه می شود.از جمله کاربردهای شبکه های پیشخور، تقریب جواب معادله ی دیفرانسیل معمولی و معادله دیفرانسیل با مشتقات جزیی است. در این پایان نامه از نگاه شبکه با معماری افزایشی، روشی برای تقریب جواب این معادله ها ارائه شده که کارایی بهتری نسبت به روش های موجود با معماری ثابت خواهد داشت. آزمایشات روی مجموعه داده ها و مثال های مختلف کارایی روش های پیشنهادی در این پایان نامه را نشان می دهند.

یادگیری فعال در سیستم شخصیت شناسی از روی صدا
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی کامپیوتر 1393
  الناز محمدی   هادی صدوقی یزدی

هدف از پژوهش حاضر، بررسی رابطه¬ی بین صدای افراد و شخصیت آنها می باشد که با بررسی ویژگی-های خاص این مسئله و چالش های آن، روش هایی از حوزه یادگیری ماشین که با این ویژگی ها سازگاری دارند برای بهبود دقت شناسایی به کار گرفته خواهند شد. برای این منظور، در این پژوهش ،200دانشجو فارسی زبان (100 زن و 100 مرد) دانشگاه فردوسی مشهد در سنین 18 تا 28 سال مورد پژوهش قرار گرفتند، که از این تعداد 20 نفر آنها ، پرسشنامه پنج عامل بزرگ شخصیت را تکمیل کردند و به مدت 30 الی 120 ثانیه صدای آنها ضبط گردید و بقیه افراد فقط صدایشان ضبط شد. که با توجه به کمی داده ها ی برچسب دار و وجود حجم بسیار بالای داده های بدون برچسب در پایگاه داده های صوتی، این پژوهش برآن است تا بتواند یک توزیع توام از داده ها را بدست بیاورد. برای این راهکار، صدای افراد با استفاده از نرم افزار پرات مورد تحلیل قرار گرفت. نتایج نشان دادند که برخی از ویژگی های صدا مثل عروضی صدا و بلندی صدا با شخصیت افراد رابطه دارد. همچنین در این آزمایشات بعد از بدست آوردن یک توزیع توام از داده¬ها، روش پیشنهادی با استفاده از سه روش یادگیری فعال مبتنی بر حاشیه، مبتنی بر آنتروپی و مبتنی بر کمیته داوران بررسی شد و با استفاده از آزمون های آماری تی، ویلکاکسون و علامت مورد مقایسه قرار گرفت، نتایج نشان دادند که روش توزیع توام با استفاده از یادگیری فعال مبتنی بر کمیته داوران نسبت به دو روش دیگر، دقت شناسایی بالاتری دارد.

طبقه بند فیشر چگالی گرا
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده فنی 1393
  محبوبه قاسم پور   هادی صدوقی یزدی

مشکلات موجود در طبقه بند جداساز خطی (lda) از قبیل حساسیت به داده های پرت، فرض اولیه تک مدی بودن توزیع کلاس ها و معکوس ناپذیری ماتریس پراکندگی داخل کلاس انگیزه ای برای ارائه طبقه بندی جدید در این طرح شد. البته در تحقیقات گذشته راهکارهایی همچون استفاده از گراف همسایگی، استفاده از نرم یک و وزنی نمودن طبقه بند برای کاهش حساسیت به داده های پرت، روش هایی مانند کاهش ابعاد، بکارگیری پارامتر تنظیم ساز و تغییر در تابع هزینه lda جهت حل مشکل معکوس ناپذیری و راه حل استفاده از ناحیه همسایگی برای مشکل تک مدی بودن ارائه شده اند. در تمام موارد فوق وجود چگالی داده ها در ساختار طبقه بند جداساز خطی از نظر دور مانده است. در این طرح برآنیم با افزودن چگالی داده ها به طبقه بند lda آن را در مقابل مشکلات تاثیر داده های پرت و معکوس ناپذیری مقاوم کنیم. علاوه بر آن، توانایی طبقه بندی مجموعه داده های غیرخطی و چند مدی را داشته باشد. همچنین با به کارگیری تکنیک ترکیب طبقه بندها مانند آدابوست، طبقه بند پیشنهادی را برای طبقه بندی مجموعه داده های حجیم توانمند ساختیم. جهت انجام آزمایش از مجموعه داده های مصنوعی، کوچک، متوسط و بزرگ از جمله مجموعه داده nslkdd که در تشخیص نفوذ کاربرد دارد، بهره بردیم. نتایج نشان می دهد طبقه بند پیشنهادی مشکلات lda را به خوبی حل می کند و مجموعه داده های غیر خطی و حجیم را طبقه بندی می نماید.

ماشین بردار پشتیبان دوگانه ساختاری چگالی گرا برای مسائل خطی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی کامپیوتر 1393
  رامین رضوانی خراشادی زاده   رضا منصفی

الگوریتم ماشین بردار پشتیبان (svm)، به عنوان یکی از رایج ترین طبقه بندها، سعی در یافتن ابرصفحه ای می کند که دو کلاس از داده ها را با حداکثر حاشیه جدا کند. طبقه بندهای svm، بیشتر روی جداسازی بین کلاس ها تمرکز می کنند و توجه خاصی به استخراج ساختارهای درون داده های آموزشی نشان نمی دهند. درحالی که اخیرا کشف شده است که، اطلاعات ساختاری، به عنوان دانش پیشین ضمنی، نقش اساسی و حیاتی برای طراحی طبقه بندی خوب، در مسائل مختلف جهان طبیعی بازی می کند. اساسا، استفاده از اطلاعات ساختاری درون داده ها برای بهبود قابلیت تعمیم پذیری یک طبقه بند، کلاسی از طبقه بندهای حاشیه بزرگ ساختاری را معرفی می کند مانند ماشین حاشیه بزرگ ساختاری (structured large margin machine, slmm). اینکه چگونه اطلاعات ساختاری داده ها را برای ساختن طبقه بندی خوب اعمال کنیم، موضوع تحقیقاتی جدیدی است که اخیرا مورد توجه قرار گرفته است. همان طور که می دانیم، همه متدهای حاشیه بزرگ ساختاری (structural large margin) موجود، همه اطلاعات ساختاری درون کلاس ها را به درون یک مدل درنظر می گیرند. به عبارت دیگر، این متدها ارتباط اطلاعات ساختاری درون کلاسی و بین کلاسی را بالانس نمی کنند که سبب می شود این اطلاعات پیشین به طور کامل و کافی استخراج نشود. الگوریتم s-twsvm برای بهبود تعمیم پذیری متدهای مبتنی بر اطلاعات ساختاری معرفی شد و توانست مشکل تداخلات اطلاعات ساختاری بین دو کلاس را برطرف کند. اما در حل تداخلات و تناقض های بین اطلاعات ساختاری کلاسترهای یک کلاس ناتوان است و همچنین توانایی ممیزسازی داده های آموزشی از نقاط نویز را ندارد. در این نوشتار الگوریتمی با عنوان ماشین بردار پشتیبان دوگانه ساختاری چگالی گرا (dos-twsvm) معرفی می شود که با بهره بردن از قابلیت های s-twsvm، توانایی مدیریت کردن اطلاعات ساختاری درون کلاسی، به طوری که مسائل تداخلات اطلاعات ساختاری درون کلاسی را حل کند، دارا می‎ باشد. از طرف دیگر با تمایز کردن نقاط پرت و نویز از سایر نقاط آموزشی، قابلیت تعمیم پذیری را افزایش می دهد. در انتهای این نوشتار، الگوریتم پیشنهادی با الگوریتم s-twsvm، روی مجموعه داده ساختگی و داده های mnist و همچنین مجموعه داده های uci آزمایش می شود و برتری الگوریتم پیشنهادی از نظر صحت و دقت (accuracy) در طبقه بندی داده های تست، مشاهده می شود.

تخمین حالت مبتنی بر یادگیری قیود
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی برق و کامپیوتر 1393
  رضا ایزانلو   هادی صدوقی یزدی

تخمین حالت، یکی از مباحث اساسی در نظریه کنترل است، که در این زمینه، الگوریتم فیلتر کالمن به عنوان یکی از ابزارهای ریاضی کارآمد، جایگاه ویژه ای دارد.استفاده از دانش اضافه در امر تخمین، می تواند دقت تخمین را بالا ببرد. تمرکز اصلی این پایان نامه بر روی قیود معادله حالت است، زمانی که این قیود به طور صریح در دسترس نیستند، و هدف یادگیری این قیود در طی تخمین است. در راستای این پایان نامه ابتدا برای حل چالش بالا، یک روش مقاوم، مبتنی بر معیار بیشینه کورآنتروپی (mcc) ارائه می گردد.

حل مسائل برنامه ریزی فازی تصادفی
thesis دانشگاه تربیت معلم - سبزوار - دانشکده علوم پایه 1386
  زهرا صابری نصرآبادی   سهراب عفتی

چکیده ندارد.

تشخیص خودکار حرکات غیرعادی افراد بر اساس نحوه راه رفتن
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1387
  هما فروغی   حمیدرضا پوررضا

شناسایی و تحلیل الگوهای مختلف حرکتی انسان از روی دنباله تصاویر ویدئویی از مواردی است که در دهه های اخیر به شکل فزاینده ای مورد توجه بسیاری از محققان بینایی ماشین قرار گرفته است. یکی از مهم ترین کاربرد های مقوله تحلیل حرکات انسان، در سیستم های نظارتی بصری هوشمند می باشد که هدف آن تشخیص، بازشناسایی و ردگیری اشیاء مشخصی از دنباله تصاویر و به شکل کلی تر فهم و توصیف رفتار آن ها می باشد. چنین سیستم هایی دارای قابلیت های فراوانی می باشند و به شکل گسترده در مواردی نظیر کنترل دسترسی در نواحی خاص مانند پایگاه های نظامی و نهادهای مهم دولتی، تشخیص هویت اشخاص جهت شناسایی افراد مظنون، تحلیل تراکم و بررسی سیل جمعیت در مراکز تجاری و تفریحی و همچنین تشخیص حالات غیرمتعارف مورد استفاده قرار می گیرند. تحلیل فعالیت های فرد حاضر در صحنه به منظور شناسایی و دسته بندی رفتارهای عادی و غیرعادی وی از اهداف مهم سیستم های نظارتی بصری هوشمند می باشد. واضح است که ارائه تعریفی جامع و صریح از حرکت غیرعادی، وابسته به بستر و همچنین موقعیت و شرایطی است که فعالیت ها در آن رخ می دهند؛ اما در حالت کلی می توان حرکت غیرعادی را "حرکتی که از لحاظ زیبایی شناسی غیرمعمول باشد" تعریف نمود. به عنوان مثال حرکاتی شبیه بالا رفتن از نرده در مناطق مسکونی، افتادن بر روی زمین در آسایشگاههای سالمندان و تلوتلو خوردن در مراکز نظامی همگی به نوعی غیرعادی محسوب می گردند. به بیان دیگر هر نوع انحراف در همواری، تقارن و یا تطابق راه رفتن؛ باعث ایجاد یک حرکت غیر معمول خواهد شد. علیرغم تحقیقات گسترده در زمینه تحلیل حرکات انسان، تاکنون بررسی های بسیار محدودی در زمینه تشخیص حرکات غیرعادی انجام شده است. هدف اصلی این پایان نامه، تحلیل و طراحی سیستمی است که با استفاده از تکنیک های بینایی ماشین، عملیات بازشناسایی حرکات انسان، دسته بندی حرکات عادی و غیرعادی و شناخت انواع ناهنجاری های حرکتی را به درستی انجام دهد. بدیهی است که سیستم پیشنهادی این پایان نامه، زیرمجموع های از سیستمهای تحلیل حرکات انسان محسوب می گردد. چنین سیستم هایی شامل چندین گام اصلی میباشند. به منظور تحلیل حرکت رخ داده در پنجره زمانی، در نخستین گام عملیات تقطیع اشیاء متحرک صحنه صورت می پذیرد. درطی این گام، نواحی متناظر با اشیاء متحرک موجود در صحنه تشخیص داده می شوند. سپس درطی گام استخراج ویژگی، شاخص ترین ویژگی هایی که تمایز کافی را بین الگوهای متفاوت حرکتی ایجاد می نماید و علاوه براین در مقابل شرایط عملیاتی مختلف نیز مقاوم می باشند، از دنباله نیم رخ های باینری تشکیل شده، استخراج می گردند. درحالی که اکثر سیستم های تشخیص حرکات غیرعادی، به استخراج یک ویژگی کفایت می نمایند، در سیستم پیشنهادی از ویژگیهای متنوعی استفاده شده است که این امر سبب می شود که اولاً معایب ویژگی ها توسط یکدیگر پوشانده شود، ثانیاً نتایج حاصل از بازشناسایی قابلیت اعتماد بیشتری داشته باشند و ثالثاً مشکلات احتمالی ایجاد شده حین عمل ردگیری مانند تغییرات نور، خطاهای حاصل از تقطیع حرکت بهتر مرتفع گردند. بدین منظور در سیستم پیشنهادی از ویژگی هایی مانند هیستوگرام تصاویر افقی و عمودی بدن، بیضی محاط کننده بدن، مرکزثقل و رأس بدن و همچنین الگوهای زمانی- مکانی استفاده شده است. نهایتاً جهت تشخیص نوع فعالیت صورت گرفته بردارهای ویژگی استخراج شده در گام پیشین، به عنوان ورودی به کلاس بند داده می شوند و بدین ترتیب الگوی حرکتی فرد و همچنین عادی/غیرعادی بودن آن مشخص می گردد. در سیستم پیشنهادی از چهار کلاس بند شبکه عصبی، ova svm، ovo svm و fuzzy weighted svm (که توسط مولف طراحی گردیده است) بهره گرفته شده است. کلاس بند fwsvm جهت تعامل با پایگاه داده های حجیم و حل مشکل پیچیدگی زمانی و فضایی گام تعلیم svm معمول، طراحی شده است. نتایج حاصل از دسته بندی، کارایی مناسب و قابل قبول سیستم را نشان می دهند. همچنین مشاهده شده است که با استفاده از کلاس بند fwsvm نرخ بازشناسایی و همچنین کارایی سیستم، به شکل محسوسی افزایش می یابد. نتایج نشان داده اند که روش fwsvm در مقایسه با روشهای کلاسیک ova svm و ovo svm همواره به نتایج بهتری دست می یابد. با توجه به اینکه یکی از مشکلات شایع سیستم های بازشناسایی حرکات غیرعادی عدم توانایی در ایجاد تمایز بین حرکات ظاهراً مشابه مانند "افتادن واقعی" و "حرکت تعمدی به سمت زمین" می باشد، به نظر می رسد که با استفاده از ویژگیهای مناسب استخراج شده و همچنین کلاس بند قدرتمند طراحی شده، این مشکل به خوبی مرتفع گشته است. نکته آخر اینکه، اکثر پایگاه داده های موجود، دربرگیرنده الگوهای حرکتی محدود و غالباً همسانی می باشند و معمولاٌ ناهنجاری های حرکتی را به خوبی پوشش نمی دهند. همچنین عواملی همانند کم بودن تعداد اشخاص شرکت کننده و ثابت بودن شرایط تصویربرداری از اعتبار چنین مجموعه هایی می کاهد. لذا به منظور رفع کاستی های پایگاه داده های موجود، در این تحقیق تلاش شده است که با در نظر گرفتن مجموعه ای گسترده و متنوع از حرکات انسان و همچنین با همکاری تعداد نفرات قابل قبول با سن، قد، وزن و جنسیت متفاوت مجموعه مناسبی تهیه گردد.

ماشین بردارپشتیبان و رده بندی داده های بازه ای
thesis دانشگاه تربیت معلم - سبزوار - دانشکده علوم پایه 1388
  آمنه ارجمندزاده   سهراب عفتی

دردو دهه اخیر ماشین بر دار پشتیبان (support v ecror machine ) که ابزار قدرتمندی در زمینه آموزش هستند مورد توجه زیادی قرار گرفته اند. svm اولین بار توسط وپنیک (vapnik) در سال 1995 معرفی شد. از این الگوریتم در زمینه های شناسایی الگو و پیش بینی رگرسیون استفاده های مفیدی می شود. در این پایان نامه در فصل اول تعاریف اولیه، شرایط کان – تاکر و روش لاگرانژو در فصل دوم مسأ له ماشین بردار پشتیبان که نوعی از مسائل درجه دوم است را مورد بحث و بررسی قرار داده ایم. همچنین کاربردی از (svm) در شناسایی الگو را در همین فصل ارائه نموده ایم. از طرفی در اغلب مسائل بهینه سازی کمیت هایی که استفاده شده اند داده های دقیقی نیستند بلکه وابسته به شرایط محیطی می باشند. در مسائل دنیای واقعی پارامترها به ندرت ومعلوم هستند و معمولا تخمین زده می شوند. بنابراین در سال های اخیر دو نوع مسائل بهینه سازی یعنی برنامه ریزی با پارامترهای بازه ای و برنامه ریزی فازی مورد توجه قرار گرفته اند. در فصل سوم مسأ له ماشین بردار پشتیبان را با پارامترهای بازه ای حل کرده ایم و در فصل چهارم استفاده ازsvm در رگرسیون را بررسی نموده ایم و مسأله رگرسیون بردار پشتیبان را برای نمونه های بازه ای حل کرده ایم.