نام پژوهشگر: آسیه رشیدی نژاد

جانهی داده های گمشده در آمارگیری های پانلی با استفاده از الگوریتم em
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده اقتصاد 1388
  آسیه رشیدی نژاد   حمیدرضا نواب پور

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در انواع آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معمولاً با کاهش پاسخگو در دوره های دوم به بعد تولید داده ها مواجه هستند. این امر که منجر به نمونه ی کاهیده می شود سبب کاهش کارایی براوردگرها و غالباً نیز سبب اریبی آن ها می شود. برای برخورد با این مشکل در آمارگیری پانلی روش های ‎«جانهی»‎ و ‎«وزن دهی»‎ گوناگونی وجود دارد که از جمله ی این روش های جانهی، جانهی با الگوریتم ‎em‎ می باشد. الگوریتم ‎em‎ یک الگوریتم مکرر برای براورد ماکسیمم درستنمایی مسئله ی داده های گمشده یا ناتمام می باشد. با توجه به این که ساختار گمشدگی تصادفی فرض شده است لذا این الگوریتم برای جانهی مناسب می باشد. در این پایان نامه پس از معرفی مفهوم های اولیه آمارگیری پانلی، انواع گمشدگی در آمارگیری های پانلی و ساختارهای گمشدگی، الگوریتم ‎em‎ به عنوان روشی برای جانهی داده های گمشده معرفی می شود و به دلیل مشکلاتی که در محاسبات این الگوریتم ممکن است وجود داشته باشد چهار نوع از این الگوریتم معرفی می شود. سرانجام با استفاده از داده های آمارگیری پانلی خانواری انگلیس، توزیع نمونه گیری شبیه سازی شده و روش جانهی با الگوریتم ‎em‎ با دو روش جانهی با میانگین مشاهده های مشابه و جانهی با نمونه ی جدید از نظر معیارهای مختلف (با توجه به اثر اندازه ی نمونه، همبستگی بین دوره ها و نرخ بی پاسخی دوره) مقایسه می شوند. نتایج این مطالعه نشان می دهد که جانهی متغیر تحت بررسی در آمارگیری پانلی خانواری انگلیس با استفاده از الگوریتم ‎em‎ وقتی که همبستگی بین دو دوره زیاد باشد، عملکرد بهتری دارد.