نام پژوهشگر: عبرالرحمن راسخ
زهره سعیدی عبرالرحمن راسخ
کاهش بعد و رگرسیون هر دو از مباحث مهم در علم آمار به حساب می آیند. زمانی که تعداد متغیرهای مستقل در یک مسئله رگرسیونی زیاد باشد، تمایل به کاهش بعد متغیرها خواهیم داشت. در این پایان نامه به مطالعه مفاهیم کاهش بعد در رگرسیون پرداختیم، این مفاهیم عموماً بین روش های کاهش بعد مشترک می باشند و توسط لی (1991) و کوک (1998) مطرح گردیده اند. روش معرفی شده در این پایان نامه برای کاهش بعد، رگرسیون وارون قطعه ای است. در این روش از مولفه های جدیدی که ترکیب خطی از متغیرهای اولیه هستند برای ساختن معادله رگرسیونی استفاده می گردد. الگوریتم این روش اولین بار توسط لی (1991) ارائه شد که در فصل سوم آن را بیان نمودیم. در ادامه الگوریتم روش رگرسیون وارون قطعه ای را برای وضعیت های خاص مانند مدل هایی که در آن ها با متغیر پاسخ چند متغیره، متغیر پاسخ دوحالتی و یا متغیر مستقل رسته ای مواجه هستیم نیز ارائه دادیم. یکی از محدودیت های روش رگرسیون وارون قطعه ای شرط خطی بودن است که در عمل بررسی آن مشکل می باشد. در فصل چهارم با استفاده از روش رگرسیون وارون قطعه ای بر مبنای خوشه بندی این محدودیت را رفع نمودیم. کوئنتز و ساراکو (2010) نشان دادند که این روش نسبت به روش رگرسیون وارون قطعه ای کاراتر می باشد. داده های مورد مطالعه این پایان نامه مربوط به عوامل موثر بر فواصل تولد شهر اهواز بود. هدف ما در این بخش کاهش بعد متغیرهای موثر بر فاصله تولد دوم با استفاده از روش رگرسیون وارون قطعه ای می باشد. به دلیل محدودیت این روش در استفاده از متغیرهای رسته ای، عوامل تاثیرگذار بر فاصله تولد دوم را به سه حالت تقسیم نمودیم. حالت اول شامل ده متغیر مستقل بود که با اجرای روش رگرسیون وارون قطعه ای به دو مولفه کاهش یافت. درحالت دوم علاوه بر ده متغیر مستقل مدل اول، متغیر رسته ای جنسیت فرزند اول نیز به متغیر های مستقل اضافه شد. برای کاهش بعد این مدل از رگرسیون وارون قطعه ای جزیی بهره گرفتیم. در این گونه مدل ها متغیر رسته ای شامل کاهش بعد نمی شود. در این حالت با استفاده از رگرسیون وارون قطعه ای جزیی نتیجه گرفتیم می توان به جای ده متغیر مستقل از چهار مولفه برای ساختن مدل استفاده کرد. در حالت های اول و دوم سطح تحصیلات زن، زمان شیردهی به فرزند اول، مطالعه زن، تعداد فرزندان مورد نظر زن و فاصله موالید مورد نظر مرد به ترتیب دارای بیشترین تاثیر در تشکیل اولین مولفه رگرسیون وارون قطعه ای بودند (بزرگی ضریب هر متغیر در برآورد بردارهای پایه زیرفضای مرکزی نشان دهنده اهمیت آن متغیر در تشکیل مولفه می باشد). به دلیل محدودیت روش رگرسیون وارون قطعه ای در حضور متغیرهای رسته ای در حالت سوم با استفاده از آنالیز مولفه های اصلی سیزده متغیر مستقل رسته ای را به سیزده متغیر پیوسته تبدیل نمودیم. سرانجام بر روی این مدل که دارای نوزده متغیر مستقل بود رگرسیون وارون قطعه ای را اجرا و مشخص گردید که با یک مولفه که ترکیب خطی از آن 19 متغیر است می توان داده ها را آنالیز کرد. روش رگرسیون وارون قطعه ای بر مبنای خوشه بندی را نیز بر روی مدل سوم اجرا نمودیم و مشاهده شد که این روش نسبت به روش رگرسیون وارون قطعه ای کاراتر می باشد.