نام پژوهشگر: حسین باغیشنی
حسین باغیشنی محسن محمدزاده
دگرگونی های عمده در حجم و پیچیدگی تحلیل داده ها در کنار پیشرفت های اساسی روش های محاسباتی، استفاده از مدل های آماری دقیقتر اما پیچیده تر را به همراه داشته اند. روشی معمول برای مدل بندی داده های ناگاوسی همبسته، استفاده از مدل های آمیخته خطی تعمیم یافته و برای داده های فضایی ناگاوسی، مدل های آمیخته خطی تعمیم یافته فضایی می باشد، که در آن همبستگی فضایی داده ها از طریق اثرات تصادفی در مدل لحاظ می شود. تحلیل مبتنی بر درستنمایی این گونه مدل ها به دلیل وجود انتگرال های با بعد بالا مشکل و پیچیده است. از طرفی تحلیل بیزی مبتنی بر روش های mcmc در کنار دو مشکل انتخاب توزیع های پیشین مناسب و وابستگی دقت نتایج به این انتخاب، از مشکلات متعددی مانند تشخیص همگرایی زنجیر و زمان طولانی محاسبات رنج می برد. همسانه سازی داده ها (dc) روشی برای برآورد پارامترهای یک مدل سلسله مراتبی است. این روش در حالی که از چارچوب بیزی و الگوریتم های mcmc بهره می برد، ترفندی محاسباتی برای محاسبه mle و برآورد واریانس آن ها است، که نیازی به حل انتگرال های با بعد بالا، ماکسییم سازی و مشتق گیری از یک تابع پیچیده ندارد و نتایج مبتنی بر آن نسبت به انتخاب توزیع های پیشین پایا هستند. در این رساله به استننباط مبتنی بر درستنمایی در مدل های آمیخته خطی تعمیم یافته برای تحلیل داده های فضایی ناگاوسی با روش های dc و درستنمایی مرکب پرداخته شده است و کارایی آن ها نیز مورد مقایسه قرار گرفته اند. از آنجا که روش dc مشکلات الگوریتم های mcmc را به ارث می برد، از ترکیب دو روش dc و تقریب لاپلاس آشیانه ای جمع بسته، روش جدید hdc پیشنهاد شده است و در مطالعات شبیه سازی کارایی آن مورد بررسی قرار گرفته و برتری آن نسبت به روش های موجود نشان داده شده است.
سید علی اصغر تجدد محمد آرشی
پس از آنکه در سال 1956، چارلز استاین نشان داد در توزیع نرمال، هنگامی که بعد فضای پارامتر بزرگتر یا مساوی 3 است، میانگین نمونه برآوردگر غیرمجاز برای میانگین توزیع نرمال است، تاکنون تلاشهای زیادی در جهت بهبود برآوردگر میانگین در حالتی که بعد فضای پارامتر بزرگتر یا مساوی 3 است انجام شده است. بهبود برآوردگرها تنها محدود به توزیع نرمال نشده است بلکه به عنوان تعمیمی از آن، در خانواده توزیع های بیضی گون که شامل توزیع های زیادی از جمله نرمال، t، اسلش و غیره می باشد، نیز مورد بررسی قرار گرفته اند. در این پایان نامه برآوردگرهای بهبودیافته، که در بازه ای خاص از فضای پارامتر بر برآوردگرهای کمترین توان های دوم برتری دارند را در مدل های چندمتغیره بیضی گون ماتریسی، معرفی و رفتار آنها را مورد بررسی قرار می دهیم. در این راستا ابتدا برای برآورد پارامتر مکان در توزیع نرمال ماتریسی، برآوردگرهای درستنمایی ماکزیمم محدودنشده، درستنمایی ماکزیمم محدودشده، انقباضی نوع استاین و انقباضی نوع استاین مثبت را معرفی، و با محاسبه دقیق مخاطره به بررسی رفتار برآوردگرهای مذکور می پردازیم. در نهایت با بکارگیری تکنیک خاصی نتایج را برای برآورد پارامتر ماتریسی مکان به خانواده توزیع های بیضی گون ماتریسی تعمیم میدهیم.
سحر رفیعی دهبنه احمد نزاکتی رضازاده
رگرسیون چندکی توصیف کاملی از وابستگی توزیع شرطی y به متغیر تبیینی x ارایه می دهد، در حالی که رگرسیون معمولی فقط وابستگی میانگین شرطی متغیر پاسخ y به متغیر تبیینی x بررسی می کند. برآورد پارامترها در رگرسیون چندکی بر اساس تابع زیان نامتقارن برای جمله خطا است و مشابه برآورد پارامترها در رگرسیون کمترین توان های دوم خطا محاسبه می شود. ایده رگرسیون چندکی بیزی با استفاده از یک تابع درستنمایی بر اساس توزیع لاپلاس نامتقارن قرار داده شده است. مدل های رگرسیون چندکی دودویی و توبیت می توانند به عنوان رگرسیون چندکی خطی با پاسخ های پیوسته پنهان که به طور کامل مشاهده نشده اند، در نظر گرفته می شود. در حالت معمول سری زمانی را با جمله خطا نرمال در نظر گرفته شده است. در این پایان نامه از فرض غیر نرمال بودن جمله خطا استفاده نموده ایم و آن را به صورت نیمه پارامتری با تابع چندک نمایی در نظر گرفته ایم و سری زمانی با تغییرات غیر نرمال، در نظر گرفته شده است. روش مطرح شده با استفاده از یک سری داده های شبیه سازی و دو مجموعه واقعی شرح داده می شود.
احسان اسحقی حسین باغیشنی
در واقعیت، رخداد پیشامدها متاثر از عواملی است که برخی از این عوامل، اثری وابسته به زمان و برخی دیگر، اثری مستقل از زمان بر رویداد این پیشامدها دارند. بنابراین مناسب است که مدلی در نظر بگیریم که مرکب از هر دو نوع پیشامد باشد. در برخی از مدل های نیمه پارامتری بقا، که برای مدل بندی داده های بازگشتی بقا منعطف و مفید هستند، ضرایب متغیرهای موجود در مدل، پویا و وابسته به زمان می باشند. در این مدل ها، برآوردگرها به صورت بسته و دقیق به دست نمی آیند و بایستی از روش های تقریبی عددی برای محاسبه آن ها استفاده نمود. شکل پیچیده این برآوردگرها، به دست آوردن توزیع آن ها را ناممکن می سازد. در این موارد، معمولا از نظریه مجانبی توزیع ها برای بررسی ویژگی های برآوردگرها استفاده می شود.
میعاد ولیپورپاشاکلایی حسین باغیشنی
در بسیاری از کاربردها، محققین علاقه مند به کشف رابطه بین یک متغیر با متغیرهای دیگر می باشند. برای این منظور، از مدل رگرسیونی که یکی از پرطرفدارترین مدل های آماری است، استفاده می شود. در بسیاری از کاربردها، ماهیت متغیر پاسخ به صورت نرخ و نسبت می باشد. به عنوان چند مثال: در علوم اقتصادی، اقتصاددانان به دنبال درک رابطه بین نرخ رشد، نرخ بیکاری، درصد تولید ملی و غیره با چند متغیر اقتصادی دیگر هستند؛ معمولا برای مدل بندی داده هایی با دامنه تغییرات $ (0,1) $، از مدل های لجستیک و پرابیت استفاده می شود. اما از آن جا که داده های نسبت یا نرخ، معمولا در یک زیرفاصله مشخصی از دامنه تغییرات خود متمرکز هستند (به عبارتی توزیع این نوع داده ها به شدت چوله است)، مدل های لجستیک و پرابیت برای مدل بندی آن ها مناسب نیستند. به عنوان مثال، به طور معمول نرخ بیکاری بیشتر از $ 30 $ درصد یا نسبت مشتریان خوش حساب کمتر از $ 70 $ درصد نیست. با توجه به این محدودیت ها، مدل مناسب و کارا برای این داده ها، رگرسیون بتا است. در این پایان نامه، پس از معرفی مدل، به برآورد پارامتر های مدل و استنباط آماری می پردازیم. سپس با استفاده از شبیه سازی، کارایی مدل پیشنهادی را مورد بررسی قرار می دهیم. در نهایت کاربرد مدل را در دو مثال واقعی، یکی داده های مربوط به درصد بنزین تبدیل شده از نفت خام و دیگری داده های مربوط به مقاوت بتن، نشان خواهیم داد.
مریم مقدم محمد کنشلو
در ذخایر معدنی، تشخیص مقادیری که در دم راست توزیع واقع شده اند، از نظر اقتصادی اهمیت ویژه ای دارند؛ در نتیجه تشخیص مرز این گونه مشاهدات در صنعت معدن اهمیت بسزایی در اکتشاف و استخراج دارد. روش های موجود برای تشخیص داده پرت فضایی، مقدار این داده ها را ارائه می کنند و معیاری جهت شناسایی مرز مقادیر بالا ارائه نمی دهند. از این رو در این پایان نامه برای شناسایی مرز مقادیر بالا، روش مرز-بالا پیشنهاد می شود، که بر مبنای عدم وجود اثر مرزی استوار است. در صورت عدم وجود اثر مرزی، مقادیر بالای مرز، هیچ گونه تاثیر پذیری از مقادیر کمتر از مرز ندارد. در این روش، نسبت تغییرنگارهای شاخص متقابل به تغییرنگار شاخص برای مرزهای پیشنهادی محاسبه شده و درصورتی که تابعی از فاصله موقعیت ها نباشد، عدم وجود اثر مرزی را نشان می دهد. همچنین اگر تغییرنگار باقی مانده شاخص مرز پیشنهادی، اثر قطعه ای تام را نشان دهد، آنگاه مرز پیشنهادی به عنوان مرز مقادیر بالا انتخاب می گردد. ارزیابی عملکرد این روش و نیز برخی روش های تشخیص داده پرت، در یک مطالعه شبیه سازی انجام شده است. همچنین به عنوان یک مورد مطالعاتی واقعی، از این روش برای تشخیص مرز مقادیر بالای عیار داده های طلای ساری گونای در استان کردستان، استفاده شده و در نتیجه مرز ppm 63/4 به عنوان مرز عیار بالای طلای ساری گونای انتخاب گردید.
مهناز عجم حسین باغیشنی
در بسیاری از مسایل تحلیل پاسخ های نرخ و نسبت مانند نرخ تورم، نرخ رشد، درصد مشتریان خوش قول در یک بنگاه اقتصادی، و درصد یک بیماری در منطقه ای خاص، علاقه مند به کشف عوامل موثر بر متغیر پاسخ هستیم. این هدف، معمولا با مدل های رگرسیونی قابل دستیابی است. مقیاس این گونه پاسخ ها، پیوسته و محدود به فاصله (0,1) است. برای تحلیل رگرسیونی این نوع داده ها، اولین گزینه هایی که به ذهن می رسد استفاده از مدل های رگرسیونی لجستیک یا پروبیت است. اما از آن جا که توزیع این نوع پاسخ ها معمولا به شدت چوله است، این مدل ها برای آن ها مناسب نیستند. مدلی که با ماهیت داده های نرخ و نسبت سازگاری منطقی و مناسبی دارد، مدل رگرسیون بتا می باشد که به دلیل انعطاف بالای توزیع بتا در مدل بندی انواع چولگی ها، استفاده از آن در سال های اخیر پرطرفدار شده است. رگرسیون بتا یک عضو از رده مدل های خطی تعمیم یافته است. یک پذیره اساسی در مدل های خطی تعمیم یافته، استقلال متغیرهای پاسخ است. اما در موارد متعددی، مانند داده های طولی، داده های فضایی و سری های زمانی، پاسخ ها به هم وابسته می باشند. در این موارد، از مدل های آمیخته خطی تعمیم یافته استفاده می شود که وابستگی داده ها با وارد شدن متغیر های پنهان به مدل لحاظ می شود. برازش این مدل ها از دیدگاه بیزی ساده تر است. این سادگی مرهون انقلاب روش های نمونه گیری مونت کارلوی زنجیر مارکوفی است. بنابراین علاقه مند شدیم پاسخ های وابسته با مقیاس پیوسته و تکیه گاه محدود را از دیدگاه بیزی تحلیل کنیم.
سعید افچنگی حسین باغیشنی
روش های محاسبات بیزی تقریبی، به عنوان تکنیکی از روش های نمونه گیری مبتنی بر درستنمایی-آزاد شناخته می شوند. این روش ها، در ده سال اخیر، به عنوان راهکاری رضایت بخش برای حل مشکل استنباط بیزی مدل های با توابع درستنمایی پیچیده و رام نشدنی، معرفی شده اند. محاسبات بیزی تقریبی، برای اولین بار در ژنتیک و سپس در طیف وسیع تری از موقعیت های کاربرد ی مورد استفاده قرار گرفته شد. در طی چند سال گذشته، هر دو جنبه کاربرد و مباحث نظری این روش ها مورد نظر محققین در آمار و سایر رشته ها قرار گرفته است. با توجه به استقبال گسترده و بی سابقه از این روش ها، در این پایان نامه به معرفی الگوریتم های مختلف آن ها، بررسی برخی از مباحث نظری و نمایش چند کاربرد آن ها در مثال های واقعی و شبیه سازی، می پردازیم.
رحیم خیرگو حسین باغیشنی
در بسیاری از کاربردها، محققین علاقه مند به تقریب تابع توزیع احتمال می باشند. یکی از روش هایی که برای این منظور به کار گرفته می شود، استفاده از بسط اچوورث است. بسط اچوورث به صورت یک سری نوشته می شود که توزیع احتمال را بر حسب گشتاورها یا انباشتک هایش، تقریب می زند. این بسط را می توان ابتدا به وسیله بسط تابع توزیع، بر حسب توابع متعامد هرمیتی، و سپس جمع کردن عبارات توانی بر حسب اندازه نمونه نتیجه گرفت. در این پایان نامه، با استفاده از اتحاد استاین و ویژگی چند جمله ای های هرمیتی، برای توزیع های پسین، با استفاده از بسط سری های اچوورث، تقریب مناسبی را به دست می آوریم. سپس مقایسه ای بین این روش و روش های قبلی معرفی شده انجام می دهیم. در پایان، عملکرد تقریب توزیع پسین حاصل از این روش را در دو مثال بررسی می کنیم.
حانیه کیهانی حسین باغیشنی
برای مدل بندی داده هایی از جنس نرخ و نسبت مدل رگرسیون بتا پیشنهاد می شود. در صورتی که داده پرت داشته باشیم مدل رگرسیون مستطیلی بتا پیشنهاد می شود. زیرا مدل رگرسیون بتا نسبت به نقاط پرت تنومند نیست. پس از معرفی توزیع مستطیلی بتا به مدل بندی آن و استنباط بیزی روی آن می پردازیم و در استنباط بیزی از نمونه گیری مونت کارلوی زنجیر مارکوفی استفاده می کنیم. با شبیه سازی تأثیر نقاط دورافتاده و کارایی مدل رگرسیون مستطیلی بتا را بررسی کرده برآورد ضرایب رگرسیون توزیع پسین پارامترها را به دست می آوریم.