نام پژوهشگر: جهانچهر جواهری

مقایسه کاربرد رگرسیون لجستیک با روش پروبیت در تجزیه و تحلیل متغیرهای دوتایی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه 1389
  جهانچهر جواهری   پرویز نصیری

چکیده آنالیز رگرسیون ابزاری بسیار مفید برای بررسی رابطه و همبستگی بین دو و یا چندمتغیر است و به علت قابلیت های خوب کاربردی، امروزه وسیله مفیدی برای رشته های مختلف علوم است. در آنالیز رگرسیون در حالت خاص با متغیر های وابسته ای که فقط 2 مقدار دارند سروکار داریم. در این حالت می توان از رگرسیون لجستیک و رگرسیون پروبیت برای آنالیز روابط بین متغیر وابسته و چند متغیر مستقل استفاده کرد. هدف این آنالیز تنظیم عوامل موثر، بخش بندی کواریت های مهم مربوط به متغیر وابسته و پیشگوئی مقدار متغیر وابسته است. این دو رگرسیون از نظر کیفی نتایج مشابهی دارند، ولی برآورد پارامترهای دو مدل را نباید به طور مستقیم مورد مقایسه قرار داد. لجیت و پروبیت هر دو شکلی از تبدیل داد های دوحالتی (دوتایی) هستند. هر دوی این آنالیزها از مدل های احتمال خطی بمنظور برآورد پارامترهای مدل استفاده می کنند و حالت خاصی از مدل های عمومی خطی هستند. برای محاسبه پارامترهای مدل، تخمین حداکثر درستنمایی از پارامترهای رگرسیون را محاسبه می کنند و برای بیشینه کردن و رسیدن به حداکثر درستنمایی روش fishers scoring مورد استفاده قرار می گیرد. در نهایت در هر دو روش در صورت رسیدن به حداکثر درستنمایی پارامترهای مدل برآورد می شود. هر دو روش برای رسیدن به حداکثر درستنمایی از رویه مکرر استفاده می کنند. در حالتی که توزیع تجمعی پاسخ ها در برابر داده ها از توزیع نرمال تبعیت نکند پیشنهاد می شود بجای تبدیل پروبیت از تبدیل لجیت استفاده کنیم و در صورتی که توزیع تجمعی داده ها از توزیع نرمال تبعیت کنند، آنالیز پروبیت ترجیح داده می شود. در حضور تعداد زیادی سطوح متغیر مستقل تبدیل لجیت برازش بهتری را فراهم می کند و بر عکس پروبیت مدل های با اثرات تصادفی و مجموعه داده های در حد متوسط را بهتر برازش می کند. در صورتی که طرح مدونی بکار برده نشده باشد خطای برآورد احتمالات در آنالیز پروبیت نسبت به لجستیک بیشتر است و لذا در این حالت آنالیز لجستیک توصیه می شود. از مشکلات مهم همراه با این نوع رگرسیون ها می توان، نرمال نبودن متغیرها، عدم پوشش کامل نتایج و احتمال واقع شدن خارج از دامنه (1و0)، ناهمگنی واریانس توزیع ها و مشکوک بودن مقدار به عنوان معیار نکویی برازش را نام برد. مدلهای احتمال خطی از نظر منطقی خیلی جالب نیستند زیرا این مدلها فرض می کنند احتمال همزمان با افزایش x بطور خطی افزایش می یابد و اثر افزایشی x بطور ثابت باقی می ماند. این موضوع گاهی اوقات غیر واقعی است. کلمات کلیدی: رگرسیون لجستیک، رگرسیون پروبیت ، حداکثر درستنمایی