تحلیل درستنمایی ماکزیمم مدل رگرسیون لجستیک در حالتی که داده های متغیرهای پیشگو کامل نیستند ولی متغیرهای کمکی وجود دارند
نویسندگان
چکیده مقاله:
Background and Objectives: Missing data exist in many studies, e.g. in regression models, and they decrease the model's efficacy. Many methods have been suggested for handling incomplete data: they have generally focused on missing outcome values. But covariate values can also be missing.Materials and Methods: In this paper we study the missing imputation by the EM algorithm and auxiliary variable and compare the result with case-complete analysis in a logistic regression model dealing with factors that influence the choice of the delivery method.Our data came from a cross-sectional study of factors associated with the choice of the delivery method in pregnant women. The sample size in this cross-sectional study was 365 and the data were collected through interviews, using questionnaires covering several demographic variables, delivery history, attitude, and some social factors. We used standard deviations to compare the efficiency of the two methods.Results: The results show that maximum likelihood analysis by EM algorithm is more effective than case-complete analysis.The problem of missing data is common in surveys and it causes bias and decreased model efficacy. Here we show that the EM algorithm for imputation in logistic regression with missing values for a discrete covariate is more effective than case-complete analysis.Conclusion: On the other hand if missing values occur for a continuous covariate then we have to use other methods or change the variable into a discrete one.
منابع مشابه
مقایسه روش بیزی (Bayesian) و کلاسیک در برآرد پارامترهای مدل رگرسیون لجستیک با وجود مقادیر گمشده در متغیرهای کمکی
Background and Aim: Logistic regression is an analytic tool widely used in medical and epidemiologic research. In many studies, we face data sets in which some of the data are not recorded. A simple way to deal with such "missing data" is to simply ignore the subjects with missing observations, and perform the analysis on cases for which complete data are available. Materials and Methods: We c...
متن کاملمدل رگرسیون لجستیک چند متغیره با داده های ناکاملی از متغیرهای مستقل
در مطالعات و آزمایشاتی که متغیر پاسخ گسسته است و دو یا بیشتر از دو مقدار را به خود اختصاص می دهد، مدل رگرسیون لجستیک به عنوان روش استاندارد آنالیز داده ها مطرح می شود. در این پایان نامه، ابتدا استفاده از پارامترهای میانگین جهت آنالیز رگرسیون پاسخ دو تایی چندگانه مطرح می شود. بدین صورت که با استفاده از نسبت های وابستگی تعریفشده در قالب پارامتر میانگین، ارتباط ها را مدلبندی می کنیم. نسبت های وابس...
بهکارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر همخطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان
Background and Objectives: Logistic regression is one of the most widely used generalized linear models for analysis of the relationships between one or more explanatory variables and a categorical response. Strong correlations among explanatory variables (multicollinearity) reduce the efficiency of model to a considerable degree. In this study we used latent variables to reduce the effects of ...
متن کاملمقایسهی دو رهیافت برای برخورد با متغیرهای کمکی گمشده در رگرسیون لوژستیک
در طول 2۵ سال گذشته پیشرفتهای روششناسانهای در زمینهی تیمار دادههای گمشده صورت گرفته است. بیشتر مطالعههای انتشاریافته روی دادههای گمشده در متغیرهای وابسته تحت شرایط گوناگون تمرکز داشتهاند. مطالعهی حاضر در پی آن است که این خلأ را با مقایسهی دو رهیافت برای برخورد با دادههای گمشده در متغیرهای کمکی رستهای در رگرسیون لوژستیک پر کند: روش امید ریاضی- ماکسیممسازی (EM) وزنها و جانهی چن...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 1 شماره None
صفحات 65- 72
تاریخ انتشار 2005-12
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023