مقایسه‌ی جانهی الگوریتم EM با دو روش جانهی میانگینی و نمونه‌های جدید در آمارگیری‌های پانلی

Authors

  • نواب‌پور, رضا
Abstract:

 در اقتصاد و سایر علوم اجتماعی، پژوهش‌گران اغلب تمایل به مدل‌بندی داده‌های پانلی که در آن واحدهای نمونه‌ای به‌‌طور مکرر در مقاطع زمانی مختلف مشاهده می‌شوند، دارند. یکی از کاربردهای داده‌های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری‌ها به ویژه آمارگیری‌های پانلی، بی‌پاسخی یک مشکل اساسی است که در داده‌های علوم اجتماعی و پزشکی به وفور رخ می‌دهد. این نوع مطالعه‌ها معمولاً با کاهش پاسخگو در دوره‌های دوم به بعد تولید داده‌ها مواجه هستند. این امر که منجر به نمونه‌ی کاهیده می‌شود سبب کاهش کارایی براوردگرها و غالباً نیز سبب اریبی آن‌ها می‌شود. برای برخورد با این مشکل در آمارگیری پانلی روش‌های «جانهی» و «وزن‌دهی» گوناگونی وجود دارد که از جمله‌ی این روش‌ها، جانهی با الگوریتم EM (Expectation Maximization Algorithm) می‌باشد. در این مقاله پس از معرفی مفهوم‌های اولیه آمارگیری پانلی، انواع گم‌شدگی در آمارگیری‌های پانلی و ساختارهای گم‌شدگی، الگوریتم EM به‌عنوان روشی برای جانهی داده‌های گم‌شده معرفی می‌شود. سپس با استفاده از داده‌های آمارگیری پانلی خانواری انگلیس (British Household Panel Survey)، روش جانهی با الگوریتم EM با دو روش جانهی دیگر از نظر معیارهای مختلف مقایسه می‌شود. نتایج این مطالعه نشان می‌دهد که جانهی متغیر تحت بررسی در آمارگیری پانلی خانواری انگلیس با استفاده از الگوریتم EM وقتی که همبستگی بین دو دوره زیاد باشد، عملکرد بهتری دارد. 

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

مقایسه ی جانهی الگوریتم em با دو روش جانهی میانگینی و نمونه های جدید در آمارگیری های پانلی

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معم...

full text

مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی

Background and Objectives: Missing data is a big challenge in the research. According to the type of the study and of the variables, different ways have been proposed to work with these data. This study compared five popular imputation approaches in addressing missing data in the questionnaires. Methods: In this study, 500 questionnaires were used for self-medication in diabetic patients. Mi...

full text

جانهی داده های گمشده در آمارگیری های پانلی با استفاده از الگوریتم em

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در انواع آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها مع...

15 صفحه اول

مقایسه‌ی دو روش جانهی لیتل-سو و نزدیک‌ترین همسایه در آمارگیری‌های پانلی به‌کمک شبیه‌سازی

چکیده. در بسیاری از نظام‌های آماری، نوعی از آمارگیری موسوم به « آمارگیری مکرر » و یا « نمونه‌گیری در طول زمان » متداول است که به شکلی مستمر در دوره‌های زمانی تکرار می‌شود. چنین آمارگیری‌هایی، اغلب به‌صورت یکی از روش‌های « مقطعی مکرر »، « چرخشی » و « پانلی » اجرا می‌شود. آمارگیری پانلی روشی است که در آن به نمونه‌ای ثابت در دوره‌های زمانی مختلف مراجعه می‌شود. در آمارگیری‌های پانلی علاوه بر بی‌پاس...

full text

مقایسه روش الگوریتم em و روش های متداول جانهی داده های گمشده: مطالعه روی پرسشنامه خوددرمانی بیماران دیابتی

مقدمه و اهداف: داده های گمشده، چالش بزرگی در پژوهش ها به شمار می آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش های گوناگونی برای کار با این داده ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده های پرسشنامه ای بود. روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده ها ...

full text

جانهی چندگانه‌ی غیر بیزی

جانهی چندگانه روشی است که به ‌طور مشخص برای براورد واریانس در حضور داده‌های گم‌شده طراحی شده است. فرمول ترکیبی روبین نیازمند آن است که روش جانهی «مناسب‌» باشد، که اساساً به این معنی است که جانهی‌ها، استخراج تصادفی از یک توزیع پسین در یک چارچوب بیزی باشند. در مؤسسات ملی آمار (NSI's National Statistical Institutes) مانند مرکز آمار نروژ،‌ روش‌هایی که برای جانهی بی‌پاسخی استفاده می‌شوند، مانند ب...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 21  issue 1

pages  89- 108

publication date 2010-09

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023