نام پژوهشگر: مهدیه شه دوست فرد
مهدیه شه دوست فرد محمد بهرامی
توزیع های آمیخته متناهی، ابزار مهمی در تحلیل داده هایی با بیش از یک مد می باشند. یک توزیع آمیخته، ترکیبی از توزیع های آماری است، وقتی که نمونه گیری از یک جامعه آماری ناهمگن، با توزیع های احتمال متفاوت انجام می شود. توزیع های آمیخته متناهی، به ویژه به دو دلیل قابل توجه هستند؛ اول اینکه می توانند جامعه هایی را توصیف کنند که در آن ها فرض تعداد متناهی زیر جامعه صحیح است. دوم اینکه حتی اگر جامعه تحت بررسی واقعی، شامل تعداد نامتناهی زیر جامعه باشد، می تواند از طریق برآوردیابی با یک توزیع آمیخته محدود شود. روش عمومی برای برآورد پارامترها در توزیع های آمیخته، الگوریتم امید ریاضی- ماکسیمم سازی است که کلاسی از الگوریتم های تکراری برای برآورد ماکسیمم درستنمایی در مسائل مربوط به داده های ناکامل است. در این حالت، تابع درستنمایی به طور یکنواخت به یک نقطه ماکسیمم موضعی یا یک نقطه زینی همگرا می شود. برآوردیابی به روش بیزی با استفاده از شبیه سازی پسین، به روش مونت کارلوی زنجیر مارکوفی امکان پذیر است. در صورتی که پیشین های مناسب به کار برده شود، چگالی پسین سره خواهد بود و در نتیجه می توان با استفاده از روش های مونت کارلوی زنجیر مارکوفی مانند نمونه گیر گیبس، تقریب صحیحی برای روش برآوردیابی بیز ایجاد کرد. استنباط توزیع های آمیخته براساس برآوردهای ماکسیمم درستنمایی، از فقدان استواری رنج می برد. وجود تعداد اندکی مشاهده اشتباه، ممکن است باعث تصمیم گیری های نادرست شود. در این پایان نامه، روش های استوار را برای استنباط درستنمایی در آمیخته های پواسن متناهی براساس برآوردهای مینیمم فاصله هلینگر ارائه می کنیم. روش آسان برای برآورد تعداد مولفه ها در یک توزیع آمیخته متناهی، استفاده از آماره نسبت درستنمایی است، برای آزمون فرض اینکه نمونه از یک توزیع آمیخته با g مولفه می آید، در مقابل این فرض که نمونه از یک توزیع آمیخته با g+1 مولفه می آید. به دلیل آنکه مقدار نسبت آمیختگی تحت فرض صفر، روی کران فضای پارامتر قرار دارد، توزیع حدی آماره نسبت درستنمایی از توزیع خی دو تبعیت نمی کند و در نتیجه شرایط نظم برقرار نمی باشد. در این پایان نامه، روشی را بررسی می کنیم که براساس آزمونی است که یک مولفه جدید تا زمانی می تواند به مدل اضافه شود که سرانجام منجربه تعداد مولفه ها در توزیع آمیخته شود. این روش در واقع، روش دنباله ای براساس آزمون نسبت درستنمایی است که از روش بازنمونه گیری برای ایجاد توزیع آماره آزمون استفاده می کند.