نام پژوهشگر: مرضیه هوشیار

کاربرد آمیخته های مقیاسی توزیع های نرمال-چوله در مدل های رگرسیون غیرخطی
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده علوم 1391
  مرضیه هوشیار   مریم شرفی

توزیع نرمال یکی از مهمترین توزیع های آماری است که در آمار نظری و آمارکاربردی نقش کلیدی دارد. در واقع، پیش فرض بسیاری از روش های آماری نرمال بودن توزیع جامعه می باشد. اما، عملاً در بسیاری از مسائل روزمره و واقعی قبول چنین فرضی معقول به نظر نمی رسد، زیرا گر چه توزیع جامعه داده ها به توزیع نرمال نزدیک است ولی بر خلاف توزیع نرمال، آن ها نوعاً نامتقارن و یا حتی دو مدی هستند. در دهه های اخیر بررسی توزیع واقعی چنین جوامعی مورد توجه آماردانان قرار گرفته است و پیامد آن معرفی خانواده توزیع های نرمال-چوله شده است. این خانواده علاوه بر تشریح واقعی توزیع چنین جوامعی، توزیع نرمال را نیز به عنوان حالت خاص در بر می گیرند. در این پایان نامه علاوه بر مروری بر توزیع نرمال-چوله به معرفی کلاسی از توزیع های تحت عنوان آمیخته های مقیاسی از توزیع نرمال-چوله (smsn) می پردازیم، این کلاس شامل تمام خانواده آمیخته های مقیاسی از توزیع نرمال می باشد. بعلاوه توزیع های نرمال-چوله، صورت های چوله برخی از توزیع های متقارن نیز اعضای این خانواده می باشند مانند: t-چوله، خط کسری-چوله و نرمال آلوده-چوله. این توزیع ها دارای دم هایی سنگین تر از نرمال-چوله می باشند و بنابراین به نظر می رسد برای استنباط استوار قابل استفاده باشند. این کلاس اولین بار توسط برانکو و دی در2001 معرفی شد. سپس کانچو و همکاران در 2009 مدل های رگرسیون غیرخطی نرمال–چوله (sn-nlm ) را معرفی کردند. در روند پایان نامه، ابتدا با فرض اینکه خطاهای مدل رگرسیون غیر خطی از توزیع smsn با میانگین صفر پیروی می کند، sn-nlm را تعمیم می دهیم، و با استفاده از الگوریتم em پارامترهای مدل را برآورد می کنیم. سپس به گسترش آنالیز بیزی برای مدل های رگرسیون غیرخطی براساس آمیخته های مقیاسی از توزیع نرمال-چوله می پردازیم. این کلاس از مدل ها، تعمیمی از مدل های رگرسیون غیرخطی متقارن می باشد زیرا توزیع های خطا هم توزیع های دم-سنگین و هم چوله را در برمی گیرند. یکی از ویژگی های خوب این کلاس از توزیع ها، دارا بودن نمایش سلسله مراتبی خوبی است که باعث می شود برای شبیه سازی نمونه هایی از توزیع توام پسین از روش های مونت کارلو زنجیر مارکوف) (mcmc استفاده کرد. در ادامه با توجه به پیشرفت های اخیر درفن آوری محاسباتی، به بررسی رفتار بیزی از طریق روش های نمونه گیری مونت کارلوی زنجیر مارکوف (mcmc) برای مدل های رگرسیون غیرخطی براساس کلاس توزیع های آمیخته های مقیاسی از توزیع نرمال چوله پرداخته و به منظور بررسی جنبه های قوی از این کلاس انعطاف پذیر در برابر مشاهدات دور افتاده و موثر، به ارائه مبحث تشخیص داده موثر در روش بیزی بر اساس واگرایی کولبک-لیبلر (k-l divergence ) می پردازیم و در نهایت، با توجه به معیار های انتخاب مدل مانند آماره پیشگو شرطی (cpo) ، انحراف معیاراطلاع (dic) ، معیار اطلاع آکائیکه مورد انتظار (eaic) و معیار اطلاع بیزی مورد انتظار (ebic) بهترین مدل برازش شده را انتخاب می کنیم.