نام پژوهشگر: امین قلم فرسا مستوفی
مریم رضایی امین قلم فرسا مستوفی
چکیده: مقایسه چند آزمون تقارن با استفاده از روش بوت استراپ یکی از مهمترین مباحث در آمار که کاربرد فراوانی در عمل و مسائل روزمره دارد، مبحث بررسی تقارن توزیع داده های مورد مطالعه است. برای مثال در بعضی مسائل برای جلوگیری از تاثیر داده های پرت، متداول ترین روش، حذف 5 یا 10 درصد از بزرگترین و کوچکترین داده ها می باشد. حذف داده های پرت بصورت متقارن، بستگی به تقارن توزیع داده ها دارد. اگر توزیع چوله باشد، نباید حذف داده ها بصورت متقارن از ابتدا و انتهای داده های مرتب شده انجام شود. آماره ی آزمون های تقارن معرفی شده دراین تحقیق، بر اساس دو نمونه، تصادفی ساده و جمعی رتبه ای محاسبه شده اند. آزمون هایی که با استفاده از نمونه تصادفی ساده ارائه شده اند بر اساس : تفاوت میانه (m_s) و میانگین نمونه ای(x ?) تفاوت توزیع (x_i-m_s) و ?(m?_s-x_i) عمل می کنند. اساس آزمون هایی که با استفاده از نمونه جمعی رتبه ای ارائه شده اند، رتبه ی (rank) مشاهدات می باشد. ما در این رساله با استفاده از روش بوت استراپ به مقایسه ی توان آزمون های ارائه شده می پردازیم. کلمات کلیدی: تقارن – نمونه جمعی رتبه ای – بوت استراپ
مرضیه هوشیار مریم شرفی
توزیع نرمال یکی از مهمترین توزیع های آماری است که در آمار نظری و آمارکاربردی نقش کلیدی دارد. در واقع، پیش فرض بسیاری از روش های آماری نرمال بودن توزیع جامعه می باشد. اما، عملاً در بسیاری از مسائل روزمره و واقعی قبول چنین فرضی معقول به نظر نمی رسد، زیرا گر چه توزیع جامعه داده ها به توزیع نرمال نزدیک است ولی بر خلاف توزیع نرمال، آن ها نوعاً نامتقارن و یا حتی دو مدی هستند. در دهه های اخیر بررسی توزیع واقعی چنین جوامعی مورد توجه آماردانان قرار گرفته است و پیامد آن معرفی خانواده توزیع های نرمال-چوله شده است. این خانواده علاوه بر تشریح واقعی توزیع چنین جوامعی، توزیع نرمال را نیز به عنوان حالت خاص در بر می گیرند. در این پایان نامه علاوه بر مروری بر توزیع نرمال-چوله به معرفی کلاسی از توزیع های تحت عنوان آمیخته های مقیاسی از توزیع نرمال-چوله (smsn) می پردازیم، این کلاس شامل تمام خانواده آمیخته های مقیاسی از توزیع نرمال می باشد. بعلاوه توزیع های نرمال-چوله، صورت های چوله برخی از توزیع های متقارن نیز اعضای این خانواده می باشند مانند: t-چوله، خط کسری-چوله و نرمال آلوده-چوله. این توزیع ها دارای دم هایی سنگین تر از نرمال-چوله می باشند و بنابراین به نظر می رسد برای استنباط استوار قابل استفاده باشند. این کلاس اولین بار توسط برانکو و دی در2001 معرفی شد. سپس کانچو و همکاران در 2009 مدل های رگرسیون غیرخطی نرمال–چوله (sn-nlm ) را معرفی کردند. در روند پایان نامه، ابتدا با فرض اینکه خطاهای مدل رگرسیون غیر خطی از توزیع smsn با میانگین صفر پیروی می کند، sn-nlm را تعمیم می دهیم، و با استفاده از الگوریتم em پارامترهای مدل را برآورد می کنیم. سپس به گسترش آنالیز بیزی برای مدل های رگرسیون غیرخطی براساس آمیخته های مقیاسی از توزیع نرمال-چوله می پردازیم. این کلاس از مدل ها، تعمیمی از مدل های رگرسیون غیرخطی متقارن می باشد زیرا توزیع های خطا هم توزیع های دم-سنگین و هم چوله را در برمی گیرند. یکی از ویژگی های خوب این کلاس از توزیع ها، دارا بودن نمایش سلسله مراتبی خوبی است که باعث می شود برای شبیه سازی نمونه هایی از توزیع توام پسین از روش های مونت کارلو زنجیر مارکوف) (mcmc استفاده کرد. در ادامه با توجه به پیشرفت های اخیر درفن آوری محاسباتی، به بررسی رفتار بیزی از طریق روش های نمونه گیری مونت کارلوی زنجیر مارکوف (mcmc) برای مدل های رگرسیون غیرخطی براساس کلاس توزیع های آمیخته های مقیاسی از توزیع نرمال چوله پرداخته و به منظور بررسی جنبه های قوی از این کلاس انعطاف پذیر در برابر مشاهدات دور افتاده و موثر، به ارائه مبحث تشخیص داده موثر در روش بیزی بر اساس واگرایی کولبک-لیبلر (k-l divergence ) می پردازیم و در نهایت، با توجه به معیار های انتخاب مدل مانند آماره پیشگو شرطی (cpo) ، انحراف معیاراطلاع (dic) ، معیار اطلاع آکائیکه مورد انتظار (eaic) و معیار اطلاع بیزی مورد انتظار (ebic) بهترین مدل برازش شده را انتخاب می کنیم.