نام پژوهشگر: آرش اردلان
آرش اردلان محمد صدوقی الوندی
اخیراً تحقیقات زیادی در زمینه برآورد پارامترها و استنباط آماری در مورد توزیع های نامتقارن صورت گرفته است. از آنجایی که در عمل داده های واقعی فراوانی وجود دارند که ذاتاً متقارن نیستند، کاملاً روشن است که برازش یک مدل متقارن برای چنین داده هایی مناسب نیست و ممکن است باعث از دست رفتن اطلاعات موجود در داده ها شود. بنابراین، مدل های ذاتاً چوله قسمت مهمی از برازش مدل ها بوده و مطالعه آنها نیازمند همان اندازه ای از دقت و موشکافی می باشد که برای مدل های متقارن در نظر گرفته می شود. انتخاب مدل چوله قابل استفاده برای آماردانان در مبحث انتخاب مدل کاربردی محدودیت هایی دارد. اغلب این مدل ها به دلیل این که بسیاری از مدل های چوله خواص مطلوب مشترکی را ندارند مورد استفاده قرار نمی گیرند. هدف این تحقیق معرفی یک مدل چوله جالب است که، ویژگیهای مطلوبی نسبت به مدل های چوله موجود داراست. برای رسیدن به این هدف، ما خانواده توزیع های دوپارچه نرمال-لاپلاس را معرفی می کنیم. خانواده tpnl(two-piece normal laplace) دو خانوده نمایی دوپارچه و نرمال دوپارچه را با ایجاد امکان این که یک طرف آن نرمال و طرف دیگر لاپلاس باشد کامل می کند. قسمت اول این پایان نامه مربوط به معرفی خانواده توزیع های چوله موجود و سپس تعریف خانواده tpnl و برخی خواص اولیه این خانواده از جمله ضابطه تابع توزیع و تابع چندک، تابع مولد گشتاور، گشتاورهای تمامی مرتبه ها، ضرایب چولگی و کشیدگی، توابع امتیاز با ماتریس اطلاع فیشر و همچنین فرم های نمایش تصادفی این توزیع می پردازد. برآورد پارامترها در خانواده های دو پارچه اغلب بدیهی نیست. در اکثر موارد، برآوردها فرم بسته خاصی ندارند و باید به صورت عددی محاسبه شوند. بخش دوم این پابان نامه مربوط به دو الگوریتم با اهداف معین برای یافتن برآورد های درستنمایی بیشینه می باشد. علاوه بر این، تابع درستنمایی توزیع tpnl خوش رفتار نبوده و یافتن برآوردهای درستنمایی بیشینه به صورت عادی بدست نمی آیند. این موضوع را با یک مثال روشن نموده ایم که در آن تابع درستنمایی توزیع tpnl دارای چندین ماکزیمم موضعی بوده و نرم افزارهای استاندارد از جمله r و matlabحتی با مقادیر اولیه کاملاً مناسب قادر به شناسایی ماکزیمم مطلق نیستند. بده صورت دقیق تر تابع درستنمایی هموار نیست. به دلیل خوش رفتار نبودن تابع درستنمایی، تئوری استاندارد خواص مجانبی برآوردگرهای درستنمایی بیشینه از جمله سازگاری و به طور حدی نرمال بودن را نمی توان برای توزیع tpnl مورد استفاده قرار داد. در این پایان نامه ما سازگاری و به طور حدی نرمال بودن برآوردگرهای درستنمایی بیشینه توزیع tpnl را با ارائه اثباتی نسبتاً دشوار (که به دلیل هموار نبودن لگاریتم تابع درستنمایی مورد نیاز بود) ثابت نمودیم. در پایان، با چند سری داده واقعی که قبلاً منتشر شده و مورد تجریه و تحلیل قرار گرفته بودند، مفید بودن خانواده توزیع tpnl را نشان دادیم. به علاوه نشان دادیم که توزیع tpnl برازش مناسب تری نسبت به سایر توزیع های چوله روی داده های مذکور دارند.
فرزین نعیمی آرش اردلان
این پایان نامه با مقدمه ای از محیط نرم افزار آماری r شروع می شود و در ادامه در رابطه با گرافیک در نرم افزار آماری r صحبت خواهد شد. همچنین در رابطه با موضوع اصلی بسته ی نرم افزاری lr{grimport}، که نقش فرآوانی در گرافیک نرم افزار آماری r دارد بحث خواهد شد، و یک نگرش در رابطه با وارد کردن تصاویر گرافیکی (بر مبنای برداری) درون نرم افزار آماری r بیان خواهد شد. این روش به طور کلی تصاویر را توسط تغییر قالب postscript (این زبان برنامه نویسی، تصاویر را به قالب های گرافیکی برداری همانند: lr{pdf}، lr{svg} و lr{postscript} ذخیره می کند) به قالب lr{rgml} درون نرم افزار آماری lr{r}، تبدیل می نماید. بسته ی lr{grimport} شامل سه محتواست: 1) یک تابع برای تبدیل فایل lr{postscript} به فایل lr{xml} توسط نرم افزار lr{r}2) یک تابع برای خواندن فایل قالب lr{xml} درون یک شی تصویری خاص (در نرم افزار آماری lr{r})3) یک تابع برای ویرایش و ترسیم تصاویر درون lr{r}.در ادامه چندین مثال کاربردی مانند وارد کردن یک لوگو و ترسیم نمودار با استفاده از نمادهای خاص footnote{lr{symbol plot}}، آورده خواهد شد، و سپس در رابطه با ایجاد تصاویر پیچیده با استفاده از بسته ی grimport مطالبی آورده خواهد شد.در آخر نیز یک نگرش برمبنای تعامل نمایش تصاویر با استفاده از گرافیک lr{r} با استفاده از زبان های برنامه نویسی lr{scalable vector graphics (svg)} و xml جهت تشریح نمودارهایی با گرفیک دوبعدی، بحث و بررسی خواهد شد، که انجام آن با استفاده از توابع زبان های برنامه نویسی lr{xml}، lr{html}، lr{svg}، lr{r} و lr{javascirpt} صورت می گیرد، و توسط کدنویسی به روش مذکور، می توان نمودارهای جذاب ایجاد نمود، که در آن کدها با انواع روش ها در یک صفحه ی html (که در یک جستجوگر وب می توان مشاهده نمود) با یکدیگر ارتباط برقرار می کنند، که با ذکر چند مثال، کاربرد این توابع بررسی خواهد شد.
حسین بهرامی چشمه علی آرش اردلان
اگرچه مدل های رگرسیونی ناپارامتری و نیمه پارامتری در زمینه ی داده های مستقل و مقطعی توسعه ی چشمگیری پیدا کرده است، اما رشد آن در زمینه ی داده های طولی محدود به چند سال اخیر می باشد. پیچیدگی آنالیز داده های طولی از اینروست ، که جمع آوری این نوع داده ها در طول زمان و با تکرار آزمایش روی آزمودنی ها، صورت می گیرد و این عمل باعث ایجاد همبستگی بین مشاهدات مختلف برای یک آزمودنی می شود. از آنجایی که روش های متعارف برای داده ای همبسته نسبت به داده های مستقل توانایی ناچیزی دارند، ما احتیاج به روش های غیر متعارفی داریم که باعث درک بهتر رفتار داده های طولی شود. مدل های آمیخته و حاشیه ای، مدل های رایج برای بررسی داده های طولی می باشند، زیرا که عامل همبستگی بین داده ها را در نظر می گیرند. همچنین روش اسپلاین جریمه دار با انتخاب موقعیت و تعداد گره ها به طور مناسب، برای برازش مدل در داده هایی که با تغییرات زیاد همراه هستند، بسیار مفید و کارا است. از سوی دیگر رگرسیون نیمه پارامتری در مقایسه با رگرسیون پارامتری و ناپارامتری انعطاف پذیری بیشتری دارد. پس مبتنی بر ویژگی داده های طولی، رگرسیون نیمه پارامتری طولی حاشیه ای با برآوردهای اسپلاین جریمه دار،گزینه ی مناسبی برای آنالیز داده های طولی است. در این پژوهش، ابتدا به بیان مدل های آمیخته و حاشیه ای پرداخته و سپس با استفاده از آن، استنباط بیزی برای مدل های ناپارامتری و نیمه پارامتری طولی حاشیه ای صورت گرفته است.
زهرا خادم بشیری آرش اردلان
انتخاب بهترین زیرمدل یکی از بحث های مهم در مدل های رگرسیونی می باشد. هدف این روش ها این است که پیش بین های مهم و پیش بین های قابل اغماض تعیین شده و رابطه ی بین متغیر پاسخ و متغیرهای پیش بین ساده تر بیان شود. علاوه بر این دقت برآوردها و در نتیجه پیش بینی مشاهدات آینده نیز افزایش یابد. فرآیندهای انتخاب متغیر کلاسیک از قبیل انتخاب بهترین زیرمجموعه و انتخاب گام به گام، اغلب از لحاظ محاسباتی پرهزینه هستند و گاهی نتایج ناپایداری نیز دارند. بنابراین با توجه به محدودیت هایی که روش های گام به گام در این زمینه دارند، می توان از روش های تنظیم بر مبنای رگرسیون جریمه دار استفاده کرد. دو روش از روش های تنظیم، رگرسیون ستیغی و رگرسیون لاسو است که روش لاسو دارای ویژگی انتخاب متغیر می باشد. از آنجا که در بیشتر موارد می توان لگاریتم تابع درستنمایی را به صورت تابع زیان و تابع چگالی توزیع پیشین را نیز به عنوان تابع جریمه تفسیر کرد، اغلب برای روش های تنظیم می توان تفسیر بیزی ارایه داد. بنابراین در این رساله لاسو را از دیدگاه بیزی مورد مطالعه قرار داده و اهمیت روش لاسو بیزی را نسبت به روش لاسو معمولی در ایجاد برآورد خطاهای استاندارد و فواصل اعتبار مناسب برای ضرایب رگرسیونی، بیان می کنیم.
شهره شریفی میناب حیدر علی مردانی فرد
در آمار از جمله ابزار مهم برای تحلیل داده ها برآورد مناسب یک تابع است که روش های مختلفی برای آن در حالت های پارامتری و ناپارامتری ارائه شده است. یکی از معروف ترین روش ها در برآورد توابع پارامتری، روش کمترین توان های دوم عادی است که در شرایط مطلوب از مزیت های زیادی برخوردار است. با این وجود یک نقطه ضعف بسیار مهم این روش تاثیرپذیری آن از نقاط دورافتاده ای است که خواسته یا ناخواسته در مجموعه ی مشاهدات حضور پیدا می کنند. ایده ی استفاده از رگرسیون استوار بر این اساس شکل گرفته است که در آن تاثیر نقاط دورافتاده را کاهش داده و به روش بکار رفته اجازه برآورد دقیق تر پارامترها را بدهد. علاوه بر این گاهی به علت حضور تعداد زیاد متغیرهای پیش بین در مدل، تفسیر آن دشوار خواهد بود. در این مواقع محقق سعی می کند تعداد متغیرهای پیش بین را کاهش داده و زیرمجموعه ای از متغیرها در بین تمام پیش بین ها انتخاب کند. یکی از روش های موثر در این زمینه استفاده از رگرسیون تاوانیده است که تاثیر آن بر اندازه پارامترها و میزان تمایل آنها به صفر می باشد. در این راستا با ترکیب هردو روش استوار و تاوانیده قادر به ارائه روش جدیدی با نام "رگرسیون با انقباض نقاط دورافتاده" هستیم که هم نسبت به روش های دیگر از استواری بیشتری برخوردار است وهم با تعمیم آن به "رگرسیون تنک با انقباض نقاط دورافتاده" قادر به انتخاب متغیر و همچنین افزایش استواری مدل خواهیم بود که از آسانی بیشتری در محاسبات و کاربرد برخوردار است. پس از معرفی این برآوردگرها به مقایسه آنها با دیگر مدل های رگرسیونی با انجام شبیه سازی خواهیم پرداخت و در نهایت به تحلیل و بررسی یک مجموعه داده واقعی توسط این روش های جدید می پردازیم.
مژگان تدین آرش اردلان
در سال های اخیر کاربردهای چشمگیر توزیع های آمیخته متناهی و مدل های مربوط به آن در علوم آماری و دیگرعلوم از جمله اقتصاد، ژنتیک، کشاورزی و $cdots$ به وفور دیده شده است. در این میان روش های برآورد پارامترهای این توزیع مورد توجه بسیاری از آماردانان قرار گرفته است. پارامترهای آمیخته ای از مدل های رگرسیونی خطی با روش حداکثر درستنمایی و با استفاده از الگوریتم $em$، بر اساس فرضیه نرمال برای جملات خطا برآورد می شود. امّا این روش مشابه با روش حداقل مربعات نسبت به نقاط پرت و توزیع خطای دم سنگین حساس است. برای حل این مسئله روش های توانمند، روش هایی هستند که توانمندی خود نسبت به نقاط دور افتاده را از طریق اصلاح تابع هدف ایجاد می کنند.
محبوبه قره چاهی آرش اردلان
در بسیاری از حوزه های علوم پزشکی و علوم رفتاری برای بررسی اثر بخشی درمان ها و هم چنین روند بیماری ها لازم است، که پاسخ مورد نظر به طور مکرر اندازه گیری شود. داده های مکرری که تکرار پاسخ در آن ها در نقاط زمانی اتفاق می افتد، داده های طولی و مطالعاتی که بر روی این داده ها انجام می شود مطالعات طولی نامیده می شود. از آنجایی که در مطالعات طولی اندازه گیری ها در طول زمان تکرار می شوند، فرض استقلال داده ها از یکدیگر برقرار نیست. هدف اصلی در این مطالعات بررسی تغییرات متغیر پاسخ در طول زمان است. از طرفی برای اینکه استنباط کاملی درباره توزیع جمعیت داشته باشیم روش رگرسیون میانگین، به ویژه زمانی که توزیع چوله باشد موثر نیست. در این شرایط نیازمند روشی هستیم که قابلیت استنباط توزیع های چوله را نیز داشته باشد. یک راه حل برای برطرف شدن این مشکل، رگرسیون چندکی است.