نام پژوهشگر: سکینه عبداله زاده
سکینه عبداله زاده فرزاد اسکندری
پیشرفت های تازه در محاسبه، قدرت اهل دانش برای گرداوری و کنکاش اطلاعات را گسترش داده است، اطلاعاتی که شاید در گذشته از آن ها چشم پوشی می شد. حال بررسی مقدار زیادی متغیر امر آسانی نیست. در چنین مواردی وقتی با داده برداری در فضای با بعد بالا سر و کار داریم، تقلیل بُعد ابزاری برای مدل بندی این گونه داده ها می باشد. مسئله تقلیل بعد برای غلبه بر "مشقت بُعد چندی" معرفی شده است. در این پایان نامه ابتدا تلاش می شود مسئله تقلیل بعد معرفی شود، سپس روش های تقلیل بعد به سه گروه تقسیم می کنیم. ابتدا روش های پارامتری تقلیل بعد مورد بررسی قرار می گیرد. این روش ها به چهار بخش، تحلیل مولفه ی اصلی، تحلیل عاملی، تقلیل بعد برای مدل های خطی تعمیم یافته و تقلیل بعد به کمک تابع های تاوان تقسیم شده اند. تحلیل مولفه ی اصلی بهترین تکنیک خطی تقلیل بعد بر اساس میانگین توان دوم خطا است. این روش بر مبنای ماتریس کوواریانس متغیرها و از مرتبه دوم است. مشابه تحلیل مولفه ی اصلی، تحلیل عاملی نیز روشی خطی و بر مبنای خلاصه داده های از مرتبه دوم می باشد. این دو روش در پایان نامه به طور اجمالی معرفی شده است. برای مدل های خطی ما ابزار معروف تقلیل بعد به نام رگرسیون وارون قطعه ای (sir) را مورد مطالعه قرار داده ایم. این روش به سادگی نگرش وارون رگرسیونی را معرفی می کند و در این روش به جای رگرسیون کردن پاسخ یک متغیره y روی پیش گوی چند متغیرهx ، xرویy رگرسیون می شود و نشان داده می شود تحت شرایط مناسب، منحنی رگرسیون وارون (e(x|y در فضای تقلیل بُعد موثر واقع می شود. بعد از آن، روش براورد متوسط واریانس قطعه ای مورد مطالعه قرار گرفته است. همانند sir در این روش نیز دامنه y به h قطعه تقسیم می شود، اما به جای محاسبه میانگین درون قطعه ها، ماتریس کوواریانس درون قطعه ها محاسبه می شود. در انتهای این بخش، طی مثالی در نرم افزار r این دو روش مورد بررسی قرار گرفته است. در بخش مربوط به تقلیل بعد به کمک تابع های تاوان، تابع تاوان و برخی انواع آن معرفی شده است. سپس به یک فرمول بندی کلی برای تقلیل بعد و براورد ضریب ها در یک مدل رگرسیونی چند متغیره ی خطی پرداخته می شود. این روش می تواند به عنوان براورد کم ترین توان دوم تاوانیده جدید در نظر گرفته شود. تاوانی که در این روش به کار گرفته می شود نُرم کای فن ماتریس ضریب ها است. در فصل سوم به رویکردهای بیزی مسئله تقلیل بعد پرداخته می شود. در این فصل چارچوب بیزی برای تقلیل بُعد نظارت شده به کمک رویکرد مدل بندی آمیخته ناپارامتری مورد توجه قرار می گیرد. در این فصل تقلیل بعد و یا در واقع دسترسی به زیر فضای تقلیل بعد با به کار بردن فرایند دیریکله برای هم پاسخ های رسته ای و هم پیوسته صورت می گیرد. در فصل آخر تکنیک های ناپارامتری تقلیل معرفی می شود. عمل کرد براورد تابع رگرسیونی به کمک روش k نزدیک ترین همسایگی بر مبنای زیرفضای میانگین مرکزی مورد بررسی قرار می گیرد. در انتها روشی تحت عنوان مدل عاملی ناپارامتری بررسی می شود.