نام پژوهشگر: علی رضا صفاری

ارزیابی و بهبود کارآیی طبقه بندهای مبتنی بر بیان پراکنده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1393
  علی رضا صفاری   عباس ابراهیمی مقدم

بیان های فوریه و ویولت نمونه هایی از کدینگ پراکنده به شمار می روند. در کدینگ پراکنده، سیگنال به کمک توابع پایه به صورت یک بردار پراکنده بیان می شود و در نتیجه نوعی کدینگ که به کدینگ پراکنده شهرت دارد، ایجاد می شود. بیان پراکنده در ابتدا به عنوان تعمیمی از بیان های سیگنال مانند بیان فوریه و بیان ویولت معرفی شد و می توان آن را به عنوان یک زیر فرآیند از کدینگ پراکنده به شمار آورد. در سال های اخیر بیان پراکنده توجه بسیاری از محققین را در زمینه های گوناگون به خود معطوف کرده است. یکی از زمینه هایی که بیان پراکنده در آن مطرح و به کار برده شده است، مبحث طبقه بندی اطلاعات می باشد. فرآیند نسبت دادن داده ها به یک مجموعه از دسته های از پیش تعیین شده، طبقه بندی اطلاعات نامیده می شود. طبقه بندی اطلاعات و طراحی یک طبقه بند کارآمد یکی از موضوعات مورد علاقه محققین در مبحث شناسایی آماری الگو است. در طی چند دهه گذشته روش های طبقه بندی زیادی معرفی و به کار برده شده اند. در این گزارش ما پایه ای ترین الگوریتم طبقه بندی مبتنی بر بیان پراکنده را معرفی می کنیم و بعد از آشنایی با جدیدترین طبقه بند مبتنی بر بیان پراکنده و بررسی کاستی ها و معایب آن، نوع کرنلی آن را که نرخ طبقه بندی بالاتری دارد ارائه می دهیم. در بخش دومِ تحقیق انجام شده در این پایان نامه، کارآیی جدید ترین الگوریتم انتشار برچسب مبتنی بر بیان پراکنده را مورد بررسی قرار می دهیم. در بسیاری از کاربرد های عملی در بینایی ماشین، تعداد بسیار کمی از نمونه ها برچسب دار بوده و لذا دقت طبقه بندی پایین است. از طرفی فرآیند برچسب زنی توسط انسان، فرآیندی بسیار زمان بر بوده که نیازمند کار تخصصی می باشد. در الگوریتم های یادگیری شبه ناظر که در چنین شرایطی بعنوان یک راه کار خوب مورد استفاده قرار می گیرند، از گراف های همسایگی و نزدیکترین همسایه برای ساخت یک گراف شباهت استفاده می شود. این گراف ها نه تنها حساسیت بالایی نسبت به نویز دارند بلکه تعیین پارامتر های بهینه و برای آن ها مشکل است. برای غلبه بر این معایب، در برخی الگوریتم های طبقه بندی، از بیان پراکنده استفاده شده است. با وجود برتری هایی که بیان پراکنده دارد، این تئوری در طی فرآیند کدینگ، اطلاعات محلی را در نظر نگرفته و حل آن نیازمند یک فرآیند بهینه سازی سنگین و زمان بر است. کدینگ llc راه حلی برای در نظر گرفتن اطلاعات محلی در حین فرآیند کدینگ می باشد. در این مقاله ما کارآیی استفاده از اطلاعات محلی را در قالب یک الگوریتم انتشار برچسب مورد بررسی قرار داده و سه الگوریتم انتشار برچسب جدید ارائه نموده ایم. نتایج آزمایش بر روی سه دیتاست آزمایشی از uci، دو دیتابیس چهره و یک دیتابیس بیومتریک نشان می دهد که الگوریتم های ما نرخ طبقه بندی بالاتری نسبت به دیگر الگوریتم ها دارند.