نام پژوهشگر: مهدی عندلیب خواه
مهدی عندلیب خواه فرزاد اسکندری
برای پاسخ به بسیاری از پرسش های علمی، نیاز به گرداوری داده ها است و گرداوری داده ها به تنهایی پاسخ گوی بسیاری از پرسش ها نیست. بنابراین امروزه تحلیل داده ها در تمام شاخه های علمی امری ضروری به شمار می آید. طی چند دهه ی اخیر تحلیل داده های رده بندی در حوزه های آمار رسمی و علوم پزشکی به طور چشم گیری متحول شده است. با توجه به کثرت وجود این داده ها، بدیهی است که تحلیل و مدل بندی آن ها می تواند تأثیر عمده ای در راستای تولید دانش آماری داشته باشد. اما در تحلیل این داده ها با دو مشکل عمده روبرو هستیم. داده های همبسته و داده های گم شده. این دو مشکل فرض آماری مشاهده های مستقل در روش های رگرسیونی سنتی را نقض می کند. با وجود این که اکثر مطالعه ها برای گرداوری تمام داده ها طراحی می شوند ولی بروز گم شدگی در داده ها نیز اجتناب ناپذیر خواهد بود. مکانیسم های گم شدگی یک مسئله ی حائز اهمیت است زیرا خصوصیات روش های برخورد با گم شدن داده ها به این مکانیسم ها مربوط می شود. با در نظر گرفتن یک متغیر نشانگر برای وضعیت گم شدگی و توزیعی برای آن، سه مکانیسم گم شدگی تصادفی،کاملاً تصادفی وغیرتصادفی برای داده ها تعریف می شوند. در چنین شرایطی روش معادله های براوردساز تعمیم یافته معرفی می شود. این رویکرد یکی از مناسب ترین روش ها را برای تحلیل فراهم می کند . در این معادله ها تنها فرض هایی که اختیار می شوند ، فرض درباره ی امید ریاضی حاشیه ای مرتبه ی اول و دوم پاسخ ها است و هیچ فرضی درباره ی توزیع کامل آنها اختیار نمی شود . حال مسئله ی مورد نظر ما تعریف می شود. با چه روش هایی بر پایه gee می توان به براورد پارامترها در حضور داده های گم شده پرداخت؟ از مهمترین روش ها در رویارویی با داده های گم شده روش جانهی است که این روش و انواع مختلف آن از جمله جانهی ساده، جانهی میانگینی و جانهی چندگانه را بیان می کنیم. روش دوم روش موسوم به وزن دهی است که در آن، سهم هر مشاهده در معادله براوردساز برابر با معکوس احتمال مشاهده شده ی آن است. روش بعدی استفاده از تقریب توزیع چندمتغیره ی نرمال است که از براورد نرمال برای پارامترهای همبستگی بهره می برد. روش دیگر آلگوریتم au است که یک روش تکراری را برای حل معادله های براوردساز تعمیم یافته در حضور داده های گم شده ارائه می کند. در پایان تلاش خواهیم کرد با یک مطالعه شبیه سازی روش های گوناگون را مقایسه کنیم. در مجموع بر حسب اریبی و خطای استاندارد نتایج شبیه سازی نشان می دهند که روش آلگوریتم au از سایر روش ها در مواجهه با داده های گم شده بهتر عمل می کند.