نام پژوهشگر: نرگس هدایت پور
نرگس هدایت پور عبدالرحمن راسخ
مطالعه ی مباحث تشخیصی در مدل های مختلف رگرسیونی دارای سابقه ی طولانی است. گاهی مجموعه ی کوچکی از داده ها اثرات نامتناسبی را بر روی نتایج حاصل از آنالیز رگرسیونی اعمال می کنند. به طوری که برآورد پارامترها یا مقادیر پیش بینی شده بیشتر تحت نفوذ این مشاهدات قرار می گیرند. شناسایی چنین مشاهداتی از طریق روش ها و معیارهایی که مبتنی بر آنالیز تأثیر است امکانپذیر بوده که در مقوله ی مباحث تشخیصی تجلی پیدا می کند. با هدف تعیین مشاهدات موثر و پرت معیارهایی همچون ماتریس پیشبینی، باقیمانده های استاندارد، dfbetas، dffitss، فاصله ی کوک و روش انتقال میانگین پیشنهاد شده است. از سوی دیگر وجود همخطی در میان متغیرهای مستقل پیامدهای نامطلوبی به همراه دارد. این پدیده روش کمترین توانهای دوم را به چالش کشیده و موجب عدم کارایی برآورد حاصل می گردد. راه بردهایی همچون به کارگیری برآورد اریب ریج، برآورد آمیخته و ترکیبی از این دو تحت عنوان برآورد ریج آمیخته با هدف اصلاح مشکل همخطی پیشنهاد شده است. حضور توأم هم خطی و مشاهدات موثر در مجموعه ی داده ها امر نامعمول و غیرمنطقی نیست بلکه یک موضوع پیچیده است. در این رساله ضمن مطالعه ی رگرسیون ریج و رگرسیون ریج تحت محدودیت های خطی تصادفی اقدام به بررسی روش ها و معیارهای تشخیصی مذکور جهت تعیین مشاهدات تأثیرگذار و پرت در روش رگرسیون ریج می کنیم. در پی آن این معیارها را به روش رگرسیونی ریج تحت محدویت های خطی تصادفی تعمیم داده و از این طریق مشاهدات تأثیرگذار و پرت را تشخیص می دهیم. در نهایت به منظور شفاف سازی و توضیح نتایج حاصل شده یک مثال عددی که طی آن مجموعه داده های واقعی سیمان پرتلند را مورد بررسی قرار داده ایم ذکر می کنیم.