به‌کارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر هم‌خطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان

نویسندگان

  • امین پورحسینقلی, محمد
  • علوی مجد, حمید
  • محرابی, یدا...
  • یاوری, پروین
چکیده مقاله:

Background and Objectives: Logistic regression is one of the most widely used generalized linear models for analysis of the relationships between one or more explanatory variables and a categorical response. Strong correlations among explanatory variables (multicollinearity) reduce the efficiency of model to a considerable degree. In this study we used latent variables to reduce the effects of multicollinearity in the analysis of a case-control study. Methods: Our data came from a case-control study in which 300 women with breast cancer were compared to 300 controls. Five highly correlated quantitative variables were selected to assess the effect of multicollinearity. First, an ordinary logistic regression model was fitted to the data. Then, to remove the effect of multicollinearity, two latent variables were generated using factor analysis and principal components analysis methods. Parameters of logistic regression were estimated using these latent as explanatory variables. We used the estimated standard errors of the parameters to compare the efficiency of models. Results: The logistic regression based on five primary variables produced unusual odds ratio estimates for age at first pregnancy (OR=67960, 95%CI: 10184-453503) and for total length of breast feeding (OR=0). On the other hand, the parameters estimated for logistic regression on latent variables generated by both factor analysis and principal components analysis were statistically significant (P<0.003). The standard errors were smaller than with ordinary logistic regression on original variables. The factors and components generated by the two methods explained at least 85% of the total variance. Conclusions: This research showed that the standard errors of the estimated parameters in logistic regression based on latent variables were considerably smaller than that of model for original variables. Therefore models including latent variables could be more efficient when there is multicollinearity among the risk factors for breast cancer.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

به کارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر هم خطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان

مقدمه و اهداف: رگرسیون لجستیک یکی از کاربردی ترین مدل های خطی تعمیم یافته برای تحلیل رابطه ی یک یا چند متغیر توضیحی بر متغیر پاسخ رسته ای است. زمانی که بین متغیرهای توضیحی همبستگی های نسبتا قوی وجود داشته باشد هم خطی چندگانه ایجاد شده، ممکن است به کاهش کارآیی مدل منجر شود. هدف این تحقیق استفاده از متغیرهای پنهان برای کاهش اثر هم خطی چندگانه در تحلیل یک مطالعه مورد ـ شاهدی است.روش کار: داده های ...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

بررسی نسبت افزایش فراوانی خانواده و برخی عوامل مرتبط با آن با استفاده از مدل رگرسیون لجستیک چندگانه در بوشهر

 Background and Aim:To assess of human force and population's programming at high level, is very important that we know rates and characteristics of population. Growth of population has direct relationship with fertility rate of women in community. To control of population and arrive to index of N.R.R.(Net reproduction rate) equal to one ,each family must be has one or tow children .Thus ,in fa...

متن کامل

بررسی نسبت افزایش فراوانی خانواده و برخی عوامل مرتبط با آن با استفاده از مدل رگرسیون لجستیک چندگانه در بوشهر

زمینه و هدف : برای ارزیابی نیروی انسانی و برنامه ریزی های جمعیتی در سطح کلان، اطلاع از میزان و خصوصیات جمعیتی بسیار مهم است. افزایش جمعیت مستقیماً به میزان باروری زنان در جامعه بستگی دارد. برای کنترل جمعیت و رسیدن به شاخص nrr=1 (net reproduction rate، میزان خالص تجدید نسل)، می بایست هر خانواده حداکثر 1 الی 2 فرزند داشته باشد. لذا در خانواده هایی که بیش از 2 فرزند دارند می بایست به دنبال عوامل مد...

متن کامل

کاربرد مدل رگرسیون کلاس پنهان در مدلسازی عوامل مرتبط با مهاجرتهای بین استانی در ایران

در مطالعه حاضر پدیده مهاجرت بین استانی در یک بازه زمانی 40 ساله مورد بررسی قرار گرفته است و استانها از لحاظ مهاجرپذیری یا مهاجرفرستی دسته بندی و علل مرتبط با مهاجرتهای بین استانی در ایران با استفاده از مدل رگرسیون کلاس پنهان مورد ارزیابی قرار گرفته است. جامعه آماری پژوهش کلیه استانهای ایران میباشند. اطلاعات مورد نیاز از منابع معتبر دولتی (مرکز آمار ایران ، وزارت صنایع ، وزارت جهاد کشاورزی) استخ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 1  شماره None

صفحات  41- 45

تاریخ انتشار 2006-02

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023