نام پژوهشگر: مسعود یارمحمدی
رضا قاسمی نجف ابادی پرویز نصیری
یکی از موضوع های قابل بحث در تحلیل مدلهای خطی آن است که شرط نرمال بودن توزیع باقیمانده ها برقرار نباشد . توزیع نرمال به دلیل دم نازکش ، در برابر انحراف از فرضیات مدل حساس است و داده های دور افتاده می تواند به استنباط پارامترها ضربه وارد کند . به همین دلیل ، در سال های اخیر روش های استوار دیگری توسعه یافته است. یکی از این روشها ی موفق جایگزین کردن توزیع های دم -سنگین تر مانند توزیع t استیودنت و توزیع لاپلاس به جای توزیع نرمال است . با توجه به اینکه مدل cev تحت فرایندهای ouوsr دارای مدل خطی بوده ،لذا جایگزینی توزیع t و توزیع لاپلاس بجای شرط نرمال بودن باقیمانده ها باعث کم اثر کردن داده های دور افتاده شده و بنابر این استفاده از این توزیع های دم- سنگین بجای شرط نرمال بودن باقیمانده ها در استنباط پارامترها کار مناسب تری است . استنباط بیزی بدلیل استفاده از اطلاعات قبلی بسیار مورد توجه محققان می باشد ولی مشکلاتی که در راه پیداکردن توزیع های پسین وجود دارد استفاده از این شیوه منحصر بفرد را با پیچیدگی هایی همراه کرده است. از جمله این پیچیدگی ها محاسبه توزیع های پسین کناری است که اغلب نیازمند انتگرال گیری از توابع با ابعاد زیاد بوده و مستلزم محاسبات بسیار پیچیده می باشد . یک روش مناسب برای محاسبه این انتگرال ها استفاده از زنجیره مارکوف مونت کارلو است . که از توزیع های پیچیده مورد علاقه شبیه سازی می کند . یک شکل عمومی از روش mcmc توسط مترو پلیس (1953) و هستینگز (1970) ارائه شد که به الگوریتم مترو پلیس – هستینگز معروف است و نمونه گیری گیبز که گمن و اسمیت (1984) آن را معرفی کردند یک حالت خاص آن می باشد .دراین روش امکان نمونه گیری از توزیع پسین هموار شد و آمار شناسان توانستن به کمک نمونه های تولید شده از توزیع پسین ، استنباط درباره ی پارامترهای مجهول مدل را انجام دهند .
محمد شوروزی پرویز نصیری
با گسترش روزافزون دانش و اطلاعات بشری، دامنه و تنوع اطلاعاتی که از منابع مختلف بدست می آید نیز گسترش می یابد و این امر نیاز به راه کارهایی جدید برای بررسی این اطلاعات جدید را روشن می سازد. امروزه درحیطه علوم پزشکی، تکنولوژی و مهندسی، علوم اجتماعی و...برنامه ریزهای خرد وکلان نیازمند پیش بینی های زمانی و مشخص کردن محدوده زمانی می باشد. به خاطر این ضرورت است که در نیم قرن گذشته روش های آماری آنالیز داده ها نظیر تحلیل بقاء توسعه قابل توجهی پیدا کرده اند. آشنایی با این مطالعات می تواند باعث گسترش تحقیقات در این زمینه در کشور شود. از طرفی با توجه به هزینه زیادی که برای این تحقیقات در نظر گرفته می شود، اهمیت این موضوع را به وضوح نشان می دهد. در این پایان نامه با ارائه روش های ترسیمی و برآوردهایی همچون کاپلان- مه یر به تعیین تابع بقاء مناسب پرداخته ایم. تعیین تابع بقاء یا تابع توزیع، به تعیین نرخ خطر و آن هم منجر به تعیین نرخ از کار افتادگی در سیستم ها (سری و موازی) می شود. در فصل سوم نرخ از کار افتادگی را در سیستم های سری و موازی که از توزیع های نمایی، رایلی و پارتو پیروی می کنند برآورد کرده ایم.
پرهام معراجی ماسوله مقدم مسعود یارمحمدی
تجزیه و تحلیل داده های سری های زمانی نامانا بدون بر طرف کردن مشکل نامانایی اکثرا به تفاسیر نادرست می انجامد. از طرفی، استفاده از روش تفاضل گیری برای مانا نمودن، منجر به از دست دادن اطلاعات و افزایش خطا در سری های زمانی کوتاه مدت می شود. جهت بر طرف کردن این مشکل، روش هم انباشتگی توسط انگل – گرنجر در سال 1987 معرفی گردید. هم انباشتگی، عبارت است از مطالعه ثبات روابط بلندمدت بین متغیرهای سری زمانی نامانا. اندیشه هم انباشتگی، در واقع رهیافتی برای حل مشکل رگرسیون های کاذب، در سری های زمانی است. در این پایان نامه، نخست مفهوم هم انباشتگی را بیان کرده سپس برای تعیین وجود یا عدم وجود رابطه هم انباشتگی بین متغیرهای تحت مطالعه، آزمون های هم انباشتگی شامل آزمون دوربین- واتسون، رگرسیون هم انباشتگی(crdw)، روش حداقل مربعات کاملا اصلاح شده(fm-ols)، روش اتورگرسیو با وقفه های گسترده(ardl) و روش فیلیپس- اولیاریس را معرفی می نماییم. از طرف دیگر چون در تحلیل سری های زمانی چندمتغیره، ممکن است بیش از یک بردار هم انباشتگی وجود داشته باشد. در آن صورت نخست مدل های اتورگرسیو برداری (var) را ارائه نموده و در ادامه، هم انباشتگی در این گونه از مدل ها را بررسی می کنیم. در پایان تآثیر سرمایه گذاری بخش دولتی و خصوصی را در اقتصاد ایران، در سال های 1338 تا 1375 بررسی می نماییم. نتایج این آزمون، نشان می دهد که فرضیه کاراتر بودن سرمایه گذاری بخش خصوصی نسبت به بخش دولتی در کوتاه مدت رد نمی گردد.
فاطمه ملکی مسعود یارمحمدی
روشهای رگرسیون کمترین توانهای دوم جزیی (pls) برای الگوسازی و برآورد پارامترهای مدل های رگرسیونی در صورت وجود هم خطی چندگانه و هنگامی که تعداد متغیرهای توضیحی بیشتر از تعداد کل مشاهدات باشد، به کار گرفته می شوند. روش pls اولین بار توسط اسوانت ولد و هارلد مارتنز (1983) در زمینه طیف سنجی ارائه شده و دی جونگ (1993) الگوریتم simpls را در مواقعی که بیش از یک متغیر پاسخ برای الگوی رگرسیونی مطرح باشد، ارائه نموده است. مشاهدات دورافتاده تاثیر بسیار زیادی در برآورد ضرایب رگرسیونی می گذارند و در این صورت استفاده از روش رگرسیونی pls، موجب از دست دادن کارایی و ارائه نتایج غیرواقعی خواهد گردید. از طرف دیگر شناسایی و حذف داده های دورافتاده از مجموعه داده ها سبب از بین رفتن اطلاعات می شود. بنابراین بهترین راه برخورد با داده های دورافتاده، استفاده از روش های استوار می باشد به طوری که آماره ها و برآوردگرهای روش مورد استفاده تحت تأثیر داده دورافتاده قرار نگیرند. در این تحقیق ضمن معرفی و بیان مدل های رگرسیونی pls، الگوریتم های متداول برای برآورد ضرایب رگرسیونی را مطرح و مورد بحث قرار می دهیم. در به کارگیری رگرسیون کمترین توانهای دوم جزیی با n مشاهده وp پارامتر درصورت انحراف از فرض هایی چون نرمال بودن توزیع خطا و زمانی که به دلیل وجود داده های دورافتاده احتمال های بیشتری در دمهای توزیع داریم روش رگرسیون استوار pls را در نظر می گیریم. این روش علاوه بر سرعت بالای محاسبات، نسبت به روش کمترین توان های دوم موثرتر بوده و به نقاط نفوذ و انواع داده های دورافتاده وزن کمتری می دهد به طوری که در به دست آوردن برآورد پارامترها بر خلاف روش کمترین توانهای دوم جزیی که به مشاهدات وزن یکسان می دهد روش استوار قادر است به آن ها وزن های نابرابر دهد به طوری که مشاهداتی که مانده های بزرگتری را تولید می کنند در این روش وزن کمتری می گیرند.
مریم مدانلو مسعود یارمحمدی
در تحیل رگرسیونی، حضور دورافتاده ها در مجموعه ی داده ها می تواند باعث انحراف برآوردگر توان های دوم کلاسیک و ایجاد نتایج غیرعادی گردد. چندین روش رگرسیون استوار به عنوان روش های جایگزین برای کمترین توان های دوم، زمانی که نقاط دورافتاده و نافذ در مجموعه داده وجود دارند، مورد مطالعه قرار گرفته است. تعدادی از این روش ها درنرم افزار sas قابل دسترس است. در این تحقیق روش های استوار موثری که در sas اجرا می شود و همچنین ابزار گرافیکی که در تشخیص انواع دورافتاده ها موثر است ارائه می کنیم.
منا صفری مسعود یارمحمدی
مسئله برآورد پارامترهای رگرسیونی در مدل رگرسیون خطی چندگانه هنگامی که همخطی چندگانه موجود باشد، بررسی می شود. تحت فرض نرمال، سه برآوردگر بیز تجربی شامل برآوردگر کمترین مربعات انقباضی، برآوردگر بیز تجربی سلسله مراتبی انقباضی و برآوردگر بیز تجربی تجزیه شده ارائه می شوند. برآوردگرها به ترتیب براساس روش مولفه های اصلی، برآوردگر کمترین مربعات دوگانه و با انتخاب پیشین های متفاوت برای پارامترهای مدل رگرسیونی به دست می آیند. نشان داده می شود که برآوردگرهای پیشنهاد شده از نظر همگرایی بهتر از برآوردگرهای کمترین مربعات هستند. همچنین نشان داده می شود که این سه برآوردگر هنگامی که همخطی چندگانه موجود باشد و از طریق شبیه سازی و مطالعات تجربی به دست آیند برآوردگرهای مفیدی هستند.
مایده قبادی مسعود یارمحمدی
روش هم انباشتگی یکی از روشهای مفید برای بررسی و تحلیل همبستگی های کوتاه مدت و بلند مدت در میان متغیرهای اقتصادی است که در سال 1987 توسط انگل و گرنجر معرفی شد . آزمون های هم انباشتگی روشی برای بررسی پارامترهای بلند مدت یا تعادلی در ارتباط با متغیرهای ریشه واحد یا نامانا هستند.چون اغلب متغیرهای اقتصادی در سطح خود مانا نیستند ، پیش شرط استفاده از اغلب روش های هم انباشتگی نامانا بودن متغیرها است . در این پایان نامه پس از معرفی فرآیندهای تصادفی مانا و آزمون های مانایی ، فرآیندهای اتورگرسیو برداری ، فرآیندهای هم انباشته و آزمون های هم انباشتگی وتحلیل هم انباشتگی اتورگرسیو برداری مورد بحث و بررسی قرار می گیرد. در پایان به بررسی ارتباط بین تولید ناخالص داخلی ، هزینه های دولت و حجم پول در ایران براساس دادهای سالانه 1386-1352 و بر اساس تحلیل هم انباشتگی var می پردازیم.
فاطمه درفشان مسعود یارمحمدی
ضریب تغییرات یکی از معیارهای پراکندگی می باشد که به صورت نسبت انحراف معیار به میانگین تعریف می شود. ضریب تغییر به عنوان شاخصی برای تعیین میزان تمرکز ریسک در بانک ها و موسسات مالی و همچنین معیاری برای اندازهگیری دقت در علوم زیستی و پزشکی بکار می رود. در این رساله استنباط آماری درباره ضریب تغییر شامل برآورد نقطه ای برآورد فاصله ای و آزمون فرض های آماری مورد مطالعه و بررسی قرار می گیرد. این مراحل برای یک و چند جانعه مورد بحث و بررسی قرار گرفته و با استفاده از شبیه سازی کامپیوتری مطالعه می شود. کاربرد این روش برای یک سری داده واقعی مورد استفاده قرار می گیرد. کلمات کلیدی:ضریب تغییرات فاصله اطمینان آزمون فرض آماری برآورد نقطه ای p_مقدار
آمنه نامجو نرگس عباسی
در تحلیل واریانس کلاسیک، پراکندگی با در نظر گرفتن مربع فاصله مشاهدات نمونه از میانگین نمونه اندازه گیری می شود. همچنین می توان از حل معادله ی درجه دوم تفاضل مشاهدات از یک ماتریس ثابت (که بعد آن به اندازه ی نمونه بستگی دارد)، فرمول دیگری برای واریانس و انجام مطالعات بیشتر ارائه داد. استفاده از میانگین در محاسبه ی واریانس افزایش دقت در محاسبه را به دنبال دارد، به خصوص اگر برنامه های رایانه ایی به کار گرفته شود. یک روش پیشنهادی دیگر برای محاسبه ی واریانس، استفاده از توزیع فراوانی، مورد بحث قرار می-گیرد در این تحقیق معیاری از اختلاف مرتبه ی اول مشاهدات و استفاده از توزیع فراوانی در محاسبه ی پراکندگی ارائه می شود. همچنین معیاری از پراکندگی برای متغیر پاسخ یک متغیره یا چندمتغیره بر اساس تمام جفت فواصل بین عناصر نمونه در نظر می گیریم و برای تجزیه ی مولفه ی فواصل مشابه، توان-های در بازه ی (0,2] را نتیجه می گیریم. در تحلیل آنالیز واریانس، آماره ی f هنگامی که توان دو است، به دست می آید. برای هر مقدار در بازه ی (0,2) این تجزیه یک آزمون نا-پارامتری برای فرض برابری توزیع در نمونه های چندتایی تعیین می کند.
سامره قربانپور مسعود یارمحمدی
نظیر رگرسیون خطی کلاسیک که با کمینه کردن مجموع مربعات باقی مانده ها، تابع میانگین شرطی را پیش بینی می کند، رگرسیون چندک قادر است تابع میانه ی شرطی و تعداد زیادی از توابع چندک شرطی را پیش بینی نماید. هنگامی که مشاهدات سانسور شده باشند، رگرسیون چندک با استفاده از شیوه ی دوباره وزن دار کردن مشاهدات، تعمیم داده شده و برآورد حاصل از این روش در برابر نقاط موثر، دور افتاده در متغیر پاسخ یا دور افتاده در متغیر توضیحی، استوار است. هدف اصلی این پایان نامه ارائه ی برآوردهای مدل رگرسیون چندک سانسور شده و مقایسه روش های برآورد با استفاده از مطالعه شبیه سازی می باشد. در پایان کاربرد روش های مذکور برای داده های واقعی مورد بحث و بررسی قرار می گیرد.
صمد مصلحی پرویز نصیری
در این پایان نامه توزیعهای پایدار گسسته و توزیعهای نیمه- پایدار گسسته با تکیه گاه اعداد صحیح نامنفی و دیگر توزیعها و چند خواص آنها را مورد بررسی قرار می دهیم. سپس فرآیند اتورگرسیو مرتبه اول با مقادیر اعداد صحیح نامنفی در ارتباط با توزیعهای حاشیه ای نیمه- پایدار گسسته بیان و همچنین فرآیند اتورگرسیو مرتبه اول آمیخته با توزیعهای حاشیه ای نیمه- پایدار هندسی مطرح می شوند. در پایان فرآیند میانگین متحرک متناظر برای چنین توزیع هایی بحث خواهد شد.
الهام غفارپور مسعود یارمحمدی
چکیده زمانی که فرض نرمال بودن داده ها پذیرفته نشود، مقدار انحراف توزیع نمونه از توزیع نرمال، توسط ضرایب کشیدگی و چولگی محاسبه می گردد. میزان نامتقارنی یک توزیع پیوسته ی یک متغیره، به عنوان چولگی توصیف می شود. ضریب چولگی کلاسیک بر اساس سه گشتاور اول داده ها بنا شده است. از آنجا که این ضریب نسبت به داده های دورافتاده بسیار حساس است، معیارهای دیگری از چولگی که در برابر داده های دورافتاده، استوار هستند، معرفی می گردد. در این تحقیق پس از معرفی معیارهای دیگر چولگی، روش های کشف داده های دورافتاده برای داده های چوله بیان می شود. سپس برای هر مشاهده، یک اندازه ی دورافتادگی را تعیین کرده و آنگاه این اندازه را با استفاده از یک اندازه ی استوار چولگی تعدیل می کنیم. در ادامه با بررسی کلیه ی مشاهدات دورافتاده ی تعدیل یافته، مشاهداتی که در این مجموعه، دارای بیشترین مقدار دورافتادگی باشند، به عنوان یک داده ی دورافتاده مورد توجه قرار می گیرد. در پایان به مقایسه ی معیارهای استوار چولگی در حالتی که داده ها سالم و یا آلوده باشند پرداخته و چند آزمون نیکویی برازش را که بر اساس معیارهای استوار چولگی و دنباله ی وزنی بنا شده پیشنهاد می کنیم.
فرزانه رحیمی مسعود یارمحمدی
روش های نمونه گیری کلاسیک، هنگامی که صفت مورد مطالعه مشخصه ای نادر یا خصوصیتی در اجتماعات انسانی باشد که افراد مایل به آشکار کردن آن نیستند، مفید نبوده منجر به برآوردهایی ناکارا می شود. برای نمونه گیری در این گونه جوامع به اصطلاح پنهان، می توان از ساختار شبکه ای جامعه و دنبال کردن پیوندها و روابطی که اعضای جامعه ی پنهان با یکدیگر دارند استفاده کرد. ساختارهای شبکه ای (یا گراف گونه) که در آن رأس ها نشان دهنده ی واحدهای نمونه گیری و یال ها نشان دهنده ی روابط میان واحدها می باشند، بسیاری از پدیده های جهان واقعی را دربر گرفته و تنها راه مدل سازی و شناسایی آنها استفاده از مکانیزم های آماری همچون روش های نمونه گیری ردیابی-پیوند می باشد. نمونه گیری از این ساختارهای شبکه ای، اریبی را در برآورد ویژگی های آماری شبکه ها ایجاد می کند که از خصوصیات ذاتی این ساختارها ناشی می شود. هدف این پایان نامه معرفی روشی برای اصلاح این اریبی ها است.
امیر مسعود ملک فر پرویز نصیری
در این پایان نامه به بررسی روش های پرکاربرد در روند هموارسازی زمانی – مکانی می پردازیم و شرایط و موارد استفاده از هر یک از این روش ها را شرح می دهیم . هموارسازی ، روش تعدیل نسبی عوامل تاثیر گذاری همچون مکان ، سطح ، روند و فصل بر مقدار داده ها است . روش هموارسازی مکانی به منظور تعدیل عوامل مکانی استفاده می گردد . با استفاده از روش هموارسازی مکانی تنها قادر به تعدیل روندهای موثر بر داده ها هستید . این روش قادر به تعدیل عوامل فصلی نیست . نوع دیگری از روش هموارسازی ، روش میانگین متحرک است . روش میانگین متحرک بر روی داده های سری های زمانی ، وقتی به عنوان عامل هموارسازی می تواند بکار رود که ، در درون داده ها هیچ گرایشی ، عامل فصلی و سطحی دخیل نباشد این روش ، وقتی که دوره زمانی داده ها کوتاه است و دوره زمانی پیش بینی ها و تعداد پیش بینی ها کم است نتایج بهینه ای را شامل خواهد شد . مدل های هموار سازی نمایی ، به عنوان میانگین های وزن دار مشاهدات قبل و مقادیر جاری استفاده می شوند اگر داده ها متاثر از گرایش ها و عوامل فصلی نباشند در چنین شرایطی برای تعدیل عوامل موثر سطح ، از روش هموارسازی نمایی ساده 1 استفاده می گردد . در غیر اینصورت اگر داده ها متاثر از گرایشهای خطی باشند آنگاه از روش هموارسازی نمایی مضاعف 2 برای تعدیل داده ها استفاده می کنیم . اگر گرایش های خطی موثر نباشد اما عوامل فصلی موثر باشند آنگاه از روش هموارسازی نمایی فصلی 3 استفاده می کنیم . اگر گرایش های خطی و عوامل فصلی هر دو موثر باشند آنگاه از روش هموارسازی نمایی سه جزئی 4 استفاده می گردد . پس از یافتن عوامل موثر ، نوبت به برآورد پارامترهای معادله هموارسازی نمایی ، جایگزینی مقادیر ، رسم نمودار داده های اصلی و هموارسازی شده می رسد .
نازنین صدیق پرویز نصیری
چکیده اخیراً توزیع جدیدی به نام توزیع تعمیم یافته نمایی توسط محققین آمار مورد توجه قرار گرفته است که مزیت های بیشتری نسبت به توزیع های قبلی از جمله توزیع گاما و وایبل دارد، در این پایان نامه به برآورد پارامترهای توزیع تعمیم یافته نمایی با روش بیز پرداخته ایم و همچنین در داده های گروه بندی شده این توزیع را مورد بررسی قرار داده و پارامترها را تحت گروه بندی و با روش بیز بدست آورده ایم. در نهایت به این نتیجه می رسیم که میانگین مربعات خطا در داده های گروه بندی کوچکتر از داده های گروه بندی نشده و معمولی است. کلمات کلیدی: توزیع تعمیم یافته نمایی، تابع توزیع پیشین، تابع توزیع پسین، تابع زیان، برآوردگر بیز.
مجتبی پاکدل توچایی مسعود یارمحمدی
تحلیل طیفی یک روش توسعه یافته برای تحلیل سری های زمانی در قلمرو فرکانس است. این روش از متداولترین شیوه های مورد استفاده برای کاهش مناسب داده ها و متعاقباً مقایسه این گونه از ثبت داده هاست. اشتباهات ذاتی یا سهوی در داده های یک سری زمانی تحت بررسی می تواند نتایج گمراه کننده و غیر سودمندی در نتایج مربوط به طیف آن داده ها برجای گذارد. به این منظور ضمن بیان انواع داده های دورافتاده در سری های زمانی و تبیین نقش حساس آن ها در نتایج، به ارائه برآورد استوار تابع چگالی طیفی می پردازیم. یکی از این روش ها یافتن تابع چگالی طیفی استوار با استفاده از تبدیل فوریه تابع اتوکوواریانس استوار شده می باشد. روش دیگر پیش وزن دار کردن برای کاهش ریسک داده های دورافتاده در تابع چگالی طیفی می باشد. سپس با انجام روش های شبیه سازی کارایی این روش ها در رابطه با وجود و عدم وجود نقاط دور افتاده از نوع جمع پذیر مورد مقایسه قرار می گیرد.
جهانچهر جواهری پرویز نصیری
چکیده آنالیز رگرسیون ابزاری بسیار مفید برای بررسی رابطه و همبستگی بین دو و یا چندمتغیر است و به علت قابلیت های خوب کاربردی، امروزه وسیله مفیدی برای رشته های مختلف علوم است. در آنالیز رگرسیون در حالت خاص با متغیر های وابسته ای که فقط 2 مقدار دارند سروکار داریم. در این حالت می توان از رگرسیون لجستیک و رگرسیون پروبیت برای آنالیز روابط بین متغیر وابسته و چند متغیر مستقل استفاده کرد. هدف این آنالیز تنظیم عوامل موثر، بخش بندی کواریت های مهم مربوط به متغیر وابسته و پیشگوئی مقدار متغیر وابسته است. این دو رگرسیون از نظر کیفی نتایج مشابهی دارند، ولی برآورد پارامترهای دو مدل را نباید به طور مستقیم مورد مقایسه قرار داد. لجیت و پروبیت هر دو شکلی از تبدیل داد های دوحالتی (دوتایی) هستند. هر دوی این آنالیزها از مدل های احتمال خطی بمنظور برآورد پارامترهای مدل استفاده می کنند و حالت خاصی از مدل های عمومی خطی هستند. برای محاسبه پارامترهای مدل، تخمین حداکثر درستنمایی از پارامترهای رگرسیون را محاسبه می کنند و برای بیشینه کردن و رسیدن به حداکثر درستنمایی روش fishers scoring مورد استفاده قرار می گیرد. در نهایت در هر دو روش در صورت رسیدن به حداکثر درستنمایی پارامترهای مدل برآورد می شود. هر دو روش برای رسیدن به حداکثر درستنمایی از رویه مکرر استفاده می کنند. در حالتی که توزیع تجمعی پاسخ ها در برابر داده ها از توزیع نرمال تبعیت نکند پیشنهاد می شود بجای تبدیل پروبیت از تبدیل لجیت استفاده کنیم و در صورتی که توزیع تجمعی داده ها از توزیع نرمال تبعیت کنند، آنالیز پروبیت ترجیح داده می شود. در حضور تعداد زیادی سطوح متغیر مستقل تبدیل لجیت برازش بهتری را فراهم می کند و بر عکس پروبیت مدل های با اثرات تصادفی و مجموعه داده های در حد متوسط را بهتر برازش می کند. در صورتی که طرح مدونی بکار برده نشده باشد خطای برآورد احتمالات در آنالیز پروبیت نسبت به لجستیک بیشتر است و لذا در این حالت آنالیز لجستیک توصیه می شود. از مشکلات مهم همراه با این نوع رگرسیون ها می توان، نرمال نبودن متغیرها، عدم پوشش کامل نتایج و احتمال واقع شدن خارج از دامنه (1و0)، ناهمگنی واریانس توزیع ها و مشکوک بودن مقدار به عنوان معیار نکویی برازش را نام برد. مدلهای احتمال خطی از نظر منطقی خیلی جالب نیستند زیرا این مدلها فرض می کنند احتمال همزمان با افزایش x بطور خطی افزایش می یابد و اثر افزایشی x بطور ثابت باقی می ماند. این موضوع گاهی اوقات غیر واقعی است. کلمات کلیدی: رگرسیون لجستیک، رگرسیون پروبیت ، حداکثر درستنمایی
سودابه مختاری عباس گرامی
در این پایان نامه، به بررسی طرح های متقاطعی با دو دوره و چهار گروه دنباله ای، سه دوره و دو، چهار و شش گروه دنباله ای و چهار دوره و دو، چهار و شش گروه دنباله ای می پردازیم که در آن ها هر واحد آزمایشی دو تیمار مختلف را دریافت می کند. هدف از بررسی این طرح ها مشخص کردن طرح بهینه ی دو تیماری است. بدین منظور براوردهای کمترین توان های دوم اثرهای مختلف را محاسبه کرده و بر اساس ملاک a-بهینگی آن ها را مقایسه کرده و بهترین طرح دو تیماری را انتخاب می کنیم. لازم به ذکر است که به منظور مقایسه ی طرح ها، معمولا فرض می کنیم که اثرهای واحد آزمایشی اثرهایی ثابت و خطاهای درون واحدی متغیرهایی مستقل با میانگین صفر و واریانس باشند.
مریم صفرنوراله مسعود یارمحمدی
چکیده برای تشخیص داده های منظم از داده های دورافتاده می توان از فواصل ماهالانوبیس استفاده کرد و با محاسبه ی مقدار برش بر مبنای توزیع فواصل بدست آمده، نقاط دورافتاده را تشخیص داد اما این در صورتی است که فرض نرمال بودن داده ها برقرار باشد لذا درمورد داده های نامتقارن این روش کارآمد نمی باشد. ازجمله روشهایی که برای تشخیص داده های دورافتاده در توزیع های چوله استفاده می شود. رسم نمودارجعبه ای تعدیل یافته و نمودار کیسه ای و همچنین محاسبه ی معیارهای دورافتادگی تعدیل یافته و مقدار برش می باشد. دراین تحقیق پس از معرفی مفاهیم مورد نیاز در تشخیص داده های دورافتاده، روشهای کشف این داده ها در مورد داده های چوله با استفاده از روشهای شبیه سازی مورد بحث و بررسی قرار می گیرد. در این راستا مقدار دورافتادگی تعدیل یافته ی هر مشاهده را بدست آورده و داده هایی که مقدار دورافتادگی آنها از یک حد استاندارد و مشخص بالاتر باشد به عنوان داده های دورافتاده در نظر می گیریم.
سعید معدنی مسعود یارمحمدی
معادلات برآوردگرتعمیم یافته ارایه شده توسط لیانگ وزیگر (1986) ، روشی برای برآورد پارامترها در مدلهای خطی تعمیم یافته است ، هنگامی که همبستگی نامشخصی در میان مشاهدات موجود باشد. این روش در برابر داده های غیر معمول و نقاط دورافتاده تحت تاثیر قرار دارد . روشهای تشخیصی و روشهای استوارسازی روشهائی هستند که به ترتیب جهت شناسائی نقاط دورافتاده و نیز کاهش اثرات این نقاط به کار می روند. در این تحقیق دو روش شناسائی داده های دورافتاده و استوارسازی را مورد بررسی قرار داده و آنها را در مورد معادلات برآوردگر تعمیم یافته به کار می بریم . روشهای تشخیصی به کاررفته تعمیم روشهائی می باشند که توسط کوک (1977) و بلسلی و همکاران (1980) در رابطه با رگرسیون خطی مطرح شده اند. روش استوارسازی به کار رفته که در اینجا آنرا معادلات برآوردگر تعمیم یافته استوار می نامیم تعمیمی از روش معادلات برآوردگر تعمیم یافته می باشد که در برابر داده هائی با قدرت نفوذ بالا استوار است . همچنین با ارائه یک مثال کاربردی روشهای تشخیصی و روش های استوارسازی را بررسی کرده و با استفاده از روش شبیه سازی روشهای استوار را با روش معادلات برآوردگر تعمیم یافته مقایسه خواهیم کرد.
طاهره محمدی علی شادرخ
زمانی که فرضهای زیربنائی در آزمون ضرائب رگرسیونی برقرار نباشد از روشهای ناپارامتری استفاده می کنیم یک گروه از این روشها که بر مبنای نمونه گیری مجدد است آزمونهای جایگشتی نام دارند که در سال 1930 توسط فیشر معرفی شدند.هدف این پایان نامه اصلاح روش فریدمن-لان به همان روشی که هو و جون روش کندی را اصلاح نمودند ،است سپس با برآورد خطای نوع اول سه روش فریدمن-لان اصلاح شده،فریدمن-لان و هو-جون با در نظر گرفتن حالتهای مختلف پس از تغییر توزیع متغیرهای مستقل مدل و توزیع متغیر خطا ،تغییراندازه نمونه و تغییر ضریب همبستگی دو متغیر مستقل مدل با 1000 بار تکرار به شبیه سازی پرداختیم و با بررسی داده ها به این نتیجه می رسیدیم که از میان سه روش مورد بررسی روش فریدمن-لان اصلاح شده به علت داشتن برآورد خطای نوع اول بهینه تر و توان بالاتر از دو روش دیگر بهتر است و روش فریدمن-لان و هو-جون اولویتهای بعدی ما هستند.
مرجان وثوقی پرویز نصیری
توزیع پواسن آمیخته در برد وسیعی از زمینه های علمی برای مدل سازی جوامع ناهمگن به کار برده شده است. هدف این پایان نامه ، معرفی توزیع پواسن و توزیع پواسن آمیخته و بیان ویژگی های آنهامی باشد. همچنین برگزیده ای از مهم ترین اعضای خانواده ترکیبات پواسن نیز معرفی شده است . این مطالعه ویژگی های جالب توزیع پواسن را آشکار می کند و به مدل هایی نظیر توزیع پواسن آماسیده در صفر و توزیع های پواسن مرکب که بواسطه ترکیب با آن ایجاد می شود ، منجر می گردد .
سامان حسینی پرویز نصیری
در این پایان نامه سعی شده است به وسیله ی آماره ی برد و آماره ی برد مرکب از رکورد های بالا، به استنباط در مورد پارامتر مقیاس توزیع نمایی پرداخته شود . استنباط شامل برآورد نقطه ای، برآورد فاصله ای (در دو حالت بیزی و کلاسیک) همچنین آزمون فرض می باشد. برای بدست آوردن برآورد های نقطه ای بیزی و برآورد های نقطه ای با کمترین میزان مخاطره از دو نوع تابع زیان توان دوم خطا و توان دوم خطای وزنی استفاده کرده ایم. علاوه بر آن برآوردهای فاصله ای با کمترین طول و برآورد های فاصله ای با دم های برابر در هر دو حالت بیزی و کلاسیک بدست آمده است.
محمد جعفری مسعود یارمحمدی
برای تحلیل های همبستگی متعارف استوار، چندین روش ارائه و بحث شده است. اولین روش براساس تعریف تحلیل های همبستگی متعارف می باشد که به دنبال یافتن ترکیبات خطی دو مجموعه از متغیرها می باشد که دارای ضریب همبستگی ماکسیمم (استوار) می باشند. دومین روش، روش تعقیب تصویر می باشد. سه روش مختلف که بر اساس تعقیب تصویر می باشند، با جزئیات مورد بررسی قرار می گیرند. آخرین روش، روش رگرسیون متناوب استوار می باشد. یک مطالعه شبیه سازی، انجام برآوردگرهای مختلف تحت چند نوع طرح نمونه گیری را مقایسه می کند. میزان استواری با استفاده از نمودار فروریزش قابل بررسی است.
محمدامین شاه نوشی فروشانی مسعود یارمحمدی
با پیشرفت تکنولوژی که باعث کاربرد رایانه ها در علوم مختلف شد علم آمار نیز از این گذر به یک باره رشد چمشگیری در کمک به بسیاری از رشته های علوم داشت و موجب پیشرفت آن ها گردیده است. ازجمله مباحث موجود درعلم آمار مبحث سری های زمانی می باشد که به واسطه کاربرد فراوان آن درعلوم مختلف باعث شده است که در هر زمینه بطور جداگانه مدلهای آن مورد بررسی قرارگیرند ازجمله ی این مدلها، مدلهای باحافظه بلندمدت می باشند که کاربردهای فراوانی درعلوم مختلف از جمله اقتصاد ، آب شناسی و اقلیم شناسی دارند. راه شناسائی مدلهای حافظه بلند از طریق شکل تابع خود همبستگی آنها می باشد که با یک نرخ هذلولی کاهش می یابد. این نرخ کاهش بسیار کند تر ازنرخ کاهش در سری های با حافظه کوتاه مدت است. مصادیق مختلفی برای مدلهای حافظه بلند وجود دارد که از جمله آنها می توان به مدلهای اتورگرسیو جمعی-کسری میانگین متحرک arfima و نوفه نرمال کسری (fgn) اشاره کرد. دلیل آنکه این مدلها به خصوص مدل arfima مورد توجه محققان علوم آماری قرار گرفته است انعطاف پذیری آنها در مدل بندی های آماری و کاربرد فراوان آنها می باشد روشهای متفاوتی برای شناسائی مدلهای حافظه بلند وجود دارد. که درفصل دوم به مهمترین آنها پرداخته ایم. بعد از شناسائی یک مدل حافظه بلند، گام بعدی مانا کردن آنها بوسیله تفاضل گیری کسری می باشد سپس برآورد پارمتر تفاضل گیری کسری و چند روش مرسوم آن معرفی گردیده اند. در فصل سوم نیز با انجام شبیه سازی این روشها با هم مقایسه شده اند، همچنین رفتار توابع اتوکوواریانس و چگالی طیفی مدلهای با حافظه بلند مدت و کوتاه مدت بوسیله ی یک مثال با هم مقایسه شده و درنهایت یک جمعبندی از مطالب ارائه شده است.
زهرا حقیقت نیا مسعود یارمحمدی
استفاده از توابع خودهمبستگی جزئی (pacf) و خودهمبستگی (acf) توسط باکس و جنکینز برای شناسایی رتبه های مدل arma(p,q) در سری های زمانی به صورت گرافیکی ارائه شده است. اما تعیین دقیق آن خصوصاً برای مدل های ترکیب شده، با رتبه های p و q غیر صفر آسان نمی باشد. در این مطالعه، یک روش جدید برای شناسایی رتبه های مدل arma(p,q) با استفاده از الگوریتم های تکاملی شامل؛ الگوریتم ژنتیک و الگوریتم بهینه سازی ازدحام ذرات ارائه می گردد. با ارائه شبیه سازی کامپیوتری الگوریتم های تکاملی برای شناسایی مدل arma(p,q) برای پارامترهای مختلف بررسی شده است.
رسول لطفی ینگیجه پرویز نصیری
با توجه به تاثیر داده های پرت بر برآورد پارامترهای یک توزیع، در این پایان نامه با استفاده از برآوردگرهای کلاسیک و بیزی میزان تاثیر داده های پرت بر این برآوردگرها با توجه به مقدار میانگین مربعات خطای هر برآوردگر مورد بررسی قرار گرفته است.
نرگس دل آرام مسعود یارمحمدی
برآوردگرهای پارامترها در مدلهای رگرسیونی سانسور شده از چپ و سانسور شده از راست مورد نظر می باشد. این شکل از برآوردگرها نیازی به شرط متقارن بودن توزیع خطاها ندارند. برآوردگرهای معرفی شده "برآوردگر سانسور از چپ"، "برآوردگر سانسور از راست"، "برآوردگر مد چارکی" و "برآوردگر میانگین وینزوری" می باشند. خاصیت سازگاری و بطور مجانبی نرمال بودن این برآوردگرها نشان داده می شود. در پایان ویژگی های این برآوردگرها در یک مطالعه شبیه سازی با استفاده از معیارهای میانگین خطا و اریبی مورد بحث و بررسی قرار می گیرد.
راضیه فرمانی اردهایی مسعود یارمحمدی
در این تحقیق به بررسی داده های با بعد بالا، که شامل داده های دورافتاده و گمشده می باشند، پرداخته می شود. روش های مختلف رگرسیون مولفه های اصلی که می توانند در صورت وجود داده های دور افتاده و گم شد ه استوار باشند بررسی می شود. سپس رگرسیون مولفه های اصلی استوار به عنوان روش رگرسیونی که بخاطر بعد بالا در متغیرهای پاسخ و پیشگو از روش تعقیب تصویر و تحلیل مولفه های اصلی برا ی کا هش بعد استفاده می کند ، و در برابر داده های دور افتاده وگم شده استوار می باشند را شرح می دهیم. سپس با استفاده از روشهای شبیه سازی برازش مدلهای رگرسیونی به داده هایی که با داده های دور ا فتاده و گم شده آلوده شده ا ندرا مورد بحث قرار می دهیم. در پایان با مقایسه روش های مختلف رگرسیونی برازش شده به داده های شبیه سازی شده، روش استوارتر در مقابل داده های دور افتاده و گم شده معرفی می گردد.
مهرداد نامور مسعود یارمحمدی
: تحلیل طیفی منفرد ssa به عنوان یک روش قدرتمند در تحلیل سری های زمانی توسعه یافته و در بسیاری مسائل علمی از آن استفاده می شود. این تحقیق روش تحلیل طیفی منفرد را تشریح می کند. برای این کار ابتدا به معرفی ماتریس هنکل و تجزیه ویژه مقدار svd می پردازیم. در ادامه روش ssa بر پایه برآوردگر مینیمم واریانس و کمترین توانهای دوم خطا برای پیش بینی سری های زمانی را معرفی می نماییم. سپس در مورد انتخاب پارامترها در ssa و ملاک های تفکیک پذیری بحث نموده و با استفاده از شبیه سازی این روش را با مدل های کلاسیک نظیر مدل های sarima باکس-جنکینز، الگوریتم arar و الگوریتم هالت وینترز مورد مقایسه قرار می دهیم. سرانجام روش های مذکور را برای داده های مربوط به قیمت طلا در ایران برای سال های 2009 تا 2011 مورد بحث و بررسی قرار می دهیم.
فریبا صادقی بی غم علی شادرخ
برآورد پارامترها یک شاخه از آمار استنباطی است که مورد علاقه ی بسیاری از محققان می باشد .توزیع گاما یک توزیع دو پارامتری از خانواده ی توزیع های احتمال پیوسته است که شامل پارامتر حالت و مقیاس می باشد .به دو روش می توان پارامترها را برآورد کرد :یکی آنکه هر دو پارامتر حالت و مقیاس را به روش حداکثر درستنمایی برآورد کرد و یا آنکه پارامتر مقیاس را پایا در نظر گرفته و به روش حداکثر درستنمایی پارامتر حالت را برآورد کرد که همان روش حداکثر درستنمایی پایا است . هدف از این پایان نامه مقایسه ی مقدار اریبی و واریانس این دو روش برآورد حداکثر درستنمایی می باشد و نتایج اثبات شده نشان خواهد دادکه واریانس و اریبی برآورد به روش حداکثر درستنمایی پایا کوچکتر از روش حداکثر درستنمایی است .
خدیجه ابراهیمی سه شنبه مسعود یارمحمدی
دوره تناوب، ویژگی جالب و مهمی در مطالعات مربوط به سری های زمانی بوده و می تواند به عنوان یک الگوی خود تکرار تعریف شود. این الگو، اطلاعات مفیدی درباره ی ساختار ذاتی در چرخه این داده ها ارائه می دهد. در این تحقیق، پس از معرفی تابع دوره نگار و آزمون g- فیشر، برآوردهای استوار در سری های زمانی و آزمون g- فیشر استوار مورد بحث و بررسی قرار می گیرد. در ادامه با استفاده از شبیه سازی تابع توان، زمان پردازش جهت شناسایی دوره تناوب توسط روشهای آزمون g- فیشر کلاسیک و استوار شده و آزمون g- فیشر که سری زمانی مورد بررسی توسط آن بوسیله روش ssa پالایش شده است مورد مقایسه قرار می گیرد.واژگان کلیدی: دوره تناوب، آزمونg، استواری، تحلیل مجموعه مقادیر ویژه.
راضیه قاسمی مسعود یارمحمدی
سریهای زمانی با حافظه بلند در علوم مختلف کاربردهای فراوانی دارند.در اینگونه سریهای زمانی ،تابع خود همبستگی دوامی نشان میدهد که نه با فرآیندهای arima(p,1.q) و نه با arima(p,0,q) سازگار است.به عبارت دیگر ضرایب خود همبستگی ،مانایی سری را تایید نکرده و پس از یکبار تفاضل گیری هم به نظر می رسد که بیش تفاضل گیری شده باشند.سریهای زمانی arfima (در حالی که فریندهای با حافظه بلند باشند)با تفاضل گیری کسری میتوان مانا کرد.به همین دلیل این سریها را اتورگرسیو میانگین متحرک تلفیق شده کسری arfima یا arima با تفاضل گیری کسری می نامند در این پایان نامه ضمن معرفی سریهای زمانی arfima شبیه سازی مطالعه میکنیم .بر اساس مطالعاتی که قبلا صورت گرفته است مدل arfima از قدرت پیش بینی کنندگی در مقایسه با مدلهای arima برخوردار است. مثالهای متعددی از فرآیندهای با حافظه بلند در طبیعت وجود دارند.این مدلها بطور گسترده در زمینه های مختلفی همچون تحلیل پدیده ژئو فیزیک نواکز و دیگران (1988 ) و بلوم فیلد (1992)،مدل بندی اقتصاد سنجی (رودبوش (1989)و سوول (1992))، تحلیل سریهای زمانی مالی (شی (1991)و چونگ (1993)) و پیش بینی بلند مدت (گوئک و پورتو–هداک (1993)،ری (1993) و ساتکلیف (1993)) استفاده شده اند.هاسکینگ(1984) ،علاوه بر تحقیق روی داده های نیل ،وجود حافظه بلند را در داده های میانگین درجه حرارت سالانه انگلستان از سال 1659 تا 1976 نیز تشخیص داده است.توسط هسلت و رفتری (1989) یکی از این مدلها برای داده های مربوط به نیروی باد پیشنهاد شده است.مدل های با حافظه بلند برای تحقیق درباره علت تغییرات آب و هوایی نیز مفید بوده اند.در اقتصاد مشاهده تجربی اثر حافظه بلند به گرنجر (1966) بر میگردد. یکی از دلایل استفاده روز افزون از آمار بیزی در مقابل آمار کلاسیک ،بالا بودن دقت محاسبات در آمار بیزی است،و این به دلیل سهیم بودن اطلاعات و عقاید پیشین کاربرد در استنباط آماری می باشد..در این پایان نامه کاربردهای اسلوب شناسی بیزی را با تحلیل داده های سریهای زمانی بلند حافظه را بررسی میکنیم.روش زنجیر مارکوف مونت کارلو(mcmc ) یک وسیله محاسباتی مهم برای به دست آوردن نمونه هایی از یک توزیع پسین می باشد.
مهدی میرشکار پرویز نصیری
در مسئله ی ساختن فواصل اطمینان برای میانگین متغیر تصادفی دوجمله ای منفی بر اساس داده های نمونه، وقتی اندازه ی نمونه بزرگ است، تکیه بر تقریبی از توزیع نرمال برای ساخت این فواصل روشی معمول است. با این وجود، نشان خواهیم داد که میانگین نمونه ی توزیع دوجمله ای منفی با پراکندگی بالا همگرایی کندی به سمت توزیع نرمال با افزایش حجم نمونه از خود نشان می دهد. به عنوان مثال، روش های استاندارد (مانند تقریب نرمال و بوت استرپ) فواصلی می سازند که طول بسیار کوتاهی داشته و در نمونه های با اندازه ی کوچک و یا با پراکندگی بالا رفتار معقولی ندارند. برای حل این مشکل در این تحقیق، روش های مبتنی بر نامساوی برنشتاین و نیز توزیع های گاما و کای اسکویر را به عنوان جایگزین هایی برای روش های استاندارد پیشنهاد می کنیم. بعلاوه اثر تحمیل فرض ابتکاری کرانداری بر داده ها را به عنوان وسیله ای برای بهبود روش برنشتاین بررسی می کنیم. همچنین یک آماره ی نسبت مربوط به پارامترهای دوجمله ای منفی ارائه می گردد که می تواند در تعیین کارایی روش کای اسکویر و ارزیابی کلیه روش های پیشنهاد شده مورد استفاده قرار گیرد. در پایان روش های پیشنهادی و استاندارد را بوسیله ی روش های شبیه سازی مقایسه می کنیم. در این شبیه سازی معلوم گشت که روش های پیشنهادی زمانی که حجم نمونه کوچک و پراکندگی داده ها بالاست فواصلی می سازند که از درصد پوشش بالاتری نسبت به روش های نرمال برخوردارند.
ساناز پناهی مرادکندی علی شادرخ
فرآیند استنباط آماری از دو رویکرد کلاسیک و بیزی قابل بررسی است. صرفنظر از نقاط قوت و ضعف هر یک از رویکردها در مسائل با ابعاد کوچک، رویکرد بیزی یک چارچوب بسیار قدرتمند برای تحلیل و تجزیه ی نتایج آزمایش های علمی با ابعاد بزرگ فراهم می کند. در این رویکرد بسیاری از کمیت های مورد علاقه به صورت انتگرال ظاهر می شوند که راه حل تحلیلی ندارند. یک رویکرد طبیعی برای حل این مشکلات محاسباتی، استفاده از تکنیک های مونت کارلو و روش های عددی است که در استنباط بیزی، روش های مونت کارلو بر روش های عددی ترجیح داده می شوند. در میان این کمیت های مورد علاقه، عامل بیز به عنوان یک ملاک، نقش کلیدی در آزمون فرض ها و انتخاب مدل ایفا می کند. در رابطه با آزمون فرض ها، عامل بیز می تواند به عنوان جانشین برای آزمون های معنی دار بیزی و کلاسیک تلقی گردد. هرچند عامل بیز برای مقایسه دو مدل است ولی در عمل می توان آن را برای مقایسه چند مدل رقیب نیز به کار برد.
فاطمه گودرزی معصومی مسعود یارمحمدی
پایان نامه با موضوع مدل بندی سریهای زمانی خود برگشت با مشاهدات گمشده بر اساس تبدیل چندجمله ای بر روی چگونگی براورد پارامتر از مدل اتورگرسیو(ar) سری زمانی تمرکز دارد. الگوریتم های براورد استاندارد برای مدل های ar با مشاهدات گم شده عملی نیستند .در این پایان نامه روش انتقال چندجمله ای برای تبدیل مدل های ar با مشاهدات گم شده به مدل های arma که تنها از مقادیر مشاهدات موجود شناسایی می شوند،بکار گرفته می شود . سپس الگوریتم گرادیان تصادفی تعمیم یافته esg و الگوریتم کمترین مربعات بازگشتی er-ls برای سری زمانی با مشاهدات گم شده را تجزیه و تحلیل کرده و پارامترهای مدل های arma را با استفاده از این الگوریتم ها براورد می کنیم ، براورد پارامتر مدلar از پارامترهای برآورد شده ی مدلarma تخمین زده می شود ،در ادامه ثابت می کنیم که پارامترهای براورد شده همگرا به مقادیر اصلی پارامترها هستند .برای درک بیشتر موضوع مثال هایی آورده می شود ، و در پایان به نتیجه گیری می پردازیم .
مینا معروضی مسعود یارمحمدی
بسیاری از سری های زمانی در علوم کاربردی تابعی مرتبه دوم متغیر با زمان هستند. در این پایان نامه، به مسأله چگونگی پیش بینی این سری های زمانی نامانا توسط موجکهای غیرکاهشی می پردازیم. با به-کارگیری کلاس فرآیندهای موجک موضعی مانا، یک پیش بینی کننده جدید بر اساس موجک ها معرفی می کنیم و معادلات پیش بینی را به صورت تعمیمی از معادلات یول- واکر بدست می آوریم. یک روش محاسباتی خودکار برای انتخاب پارامترهای الگوریتم پیش بینی پیشنهاد می کنیم و الگوریتم پیش بینی را با استفاده از روشهای شبیه سازی با روش تحلیل مقادیر ویژه منفرد (ssa) و فرآیند های اتورگرسیو میانگین متحرک تلفیق شده (arima) مورد مقایسه قرار می دهیم و نشان می دهیم توان پیش بینی روش موجک موضعی مانا (lsw) در مقایسه با سایر روش ها بهتر می باشد. در نهایت، الگوریتم پیش-بینی را برای یک سری زمانی پزشکی که ضربان قلب یک نوزاد در طول شب می باشد بکار می بریم.
حمیده درستکار مسعود یارمحمدی
در این پایان نامه برآوردگر نیمه پارامتری از خانواده برآوردگرهای لگاریتم دوره نگار رگرسیون (gph) برای برآورد پارامتر تفاضل گیری کسری در مدل اتورگرسیو میانگین متحرک جمعی کسری (arfima) که در برابر نقاط دورافتاده جمع پذیر استوار می باشد، معرفی می کنیم. شیوه یافتن این برآوردگر مبتنی بر برآوردگر استواری از تابع اتوکواریانس ام آ وای و جنتون (2000) می باشد که برای بدست آوردن یک دوره نگار استوار شده مورد استفاده قرار گرفته است. برآوردگر پارامتر حافظه بلند مدت استوار یک نوع دیگری از برآوردگر معروف پیشنهاد شده بوسیله گویک و پورتر- هداک (1983) به نام gph می باشد. نتایج شبیه سازی مونت کارلو نشان می دهند که برآوردگر پیشنهادی برای پارامتر تفاضل گیری موقعی که داده ها حاوی نقاط دورافتاده جمع پذیر باشند استوار می باشد.این پایان نامه یک شیوه برآورد استوار برای پارامتر های شاخص در مدل ارائه می کند. استراتژی برآورد ارائه شده در مقابل نقاط دورافتاده استوار است. این برآورد مبتنی بر شیوه نیمه پارامتری دو مرحله ای می باشد. در ابتدا پارامتر تفاضل گیری کسری با استفاده از یک رگرسیون از شبه دوره نگار بریده برآورد می شود و سپس در مرحله دوم پارامترهای اتورگرسیو و میانگین متحرک با استفاده از نسخه استوار شده روش یول واکر برآورد می شوند. نتایج شبیه سازی نشان می دهند که برآوردگر gph پارامتر تفاضل گیری کسری موقعی که داده ها حاوی مشاهدات نابهنجار هستند می تواند به طور قابل ملاحظه ای اریبی پیدا کند و برآوردگر استوار ارائه شده در این پایان نامه gphr عملکرد خوبی را حتی موقعی که داده ها به طور قابل ملاحظه ای حاوی مشاهدات نابهنجار می باشند، به نمایش می گذارد.
عطیه نوری مسعود یارمحمدی
تحلیل مقادیر ویژه تکین (ssa) روش جدیدی برای تجزیه سری زمانی می باشد. در این روش سری زمانی اصلی به مولفه های مستقل نظیر روند، هارمونیک و اغتشاش تجزیه می شود. این روش ناپارامتری نیازمند هیچ نوع فرض آماری نظیر مانایی سری زمانی و نرمال بودن خطاها نبوده و برای سری های زمانی کوتاه مدت نیز مفید است. یکی از مشکلات اساسی در تحلیل سری های زمانی وقوع داده های دورافتاده می باشد. جهت شناسایی و کاهش اثرات ناشی از این نقاط یکی از روش های موثر روش استوارسازی کمترین مربعات پیراسته (lts) است. در این تحقیق روش های تحلیل مقادیر ویژه تکین و کمترین مربعات پیراسته را معرفی نموده و با استفاده از روش های شبیه سازی آنها را با روش کلاسیک الگوریتم باکس- جنکینز در حضور داده های دور افتاده جهت یافتن بهترین روش برای کاهش اثر نقاط دور افتاده در تحلیل سری زمانی مورد مقایسه قرار می دهیم.هدف از انجام تحقیق این بود که روش نوین ssa را با روش استوار سازی در مدل های سری زمانی مقایسه کنیم در حالتی که این مدل ها با نقاط دورافتاده درگیر می شوند و بررسی کنیم که کدام روش در کاهش اثر این نقاط مفیدتر خواهند بود. بدین منظور مدلهای سری زمانی ar(1) وma(1) و arma(1,1) به عنوان مدل های نمونه انتخاب شدند تا بررسی شود که آیا تغییر مدلهای سری زمانی در نتیجه کار تأثیری خواهند داشت یا خیر و این بررسی در شرایطی انجام شد که تعداد داده های شبیه سازی شده(n)، پارامترهای مدل(? و?)، درصد داده های دورافتاده اضافه شده به مدل و گام های پیش بینی متغیر هستند تا میزان تغییر این گزیده ها را بر روی نتیجه کار مشاهده کنیم.
نسرین کاکاوندی پرویز نصیری
شکل ساده و درک مستقیم توزیع پیشین به ما این اجازه را می دهد که انتخاب های خودکاری از پارامترهای توزیع پیشین ارائه دهیم. این پارامترها بر طبق سطح نتیجه ضرایب انتخاب می شوند، بخصوص ضرایب سطح بالا به طور سنگین تری منقبض می شوند. برای برآورد کردن تابع، شکل بسته میانگین پسین و واریانس ضرایب موجک مجهول را به دست آورده و با استفاده از میانگین پسین ضرایب، تابع مجهول را برآورد می کنیم. سپس روش بیزی را با روش هموارسازی رگرسیون هسته مقایسه می کنطم.
اسماعیل دودانگی مسعود یارمحمدی
شبکه های عصبی مصنوعی، یکی از روش های جدید و کاربردی در آمار ریاضی بوده و در مدل سازی، شناخت مدل، خوشه بندی و پیش بینی بکار می رود. در این تحقیق پس از معرفی شبکه های عصبی مصنوعی، عوامل مختلف ساختاری، روش های متفاوت یادگیری شبکه های عصبی و انتخاب و استفاده از داده ها در فرآیند پیش بینی، مورد ارزیابی قرار می گیرد. سپس نظریه تحلیل مقادیر ویژه منفرد به عنوان روش جدیدی برای تحلیل سری زمانی معرفی می شود. در این روش نا پارامتری سری زمانی اصلی به مولفه های مستقل مانند روند، هارمونیک و اغتشاش تجزیه می شود و این روش نیازمند هیچ نوع فرض آماری نظیر مانایی سری زمانی و نرمال بودن خطاها نبوده و همچنین برای سری های زمانی کوتاه مدت نیز قابل اجرا است. در ادامه با استفاده از شبیه سازی روش های شبکه عصبی مصنوعی، تحلیل مقادیر ویژه منفرد و الگوریتم باکس-جنکینز در رابطه با پیش بینی سری های زمانی مورد مقایسه قرار می گیرد.
لیلا خدایی علی شادرخ
مدل توزیع وایبل معکوس در تحلیل قابلیت اعتماد به کار گرفته می شود. توزیع وایبل معکوس با اسامی توزیع مقادیر کرانگین نوع دوم ، لگ گامپرتز و فرشت نیز شناخته می شود. در این پایان نامه پس از بررسی اولیه ویژگی های این توزیع به استنباط بیزی در مورد توزیع وایبل معکوس برای داده های سانسور شده نوع دوم در دو حالت مختلف (پارامتر شکل معلوم و هر دو پارامتر نامعلوم) پرداخته می شود. ابتدا استنباط بیزی پارامترهای نامعلوم توزیع تحت تابع زیان توان دوم و با تابع پیشین گاما بررسی می شود که در این حالت تابع چگالی پسین نوعی از تابع چگالی گاماست و سپس بر اساس نمونه ی تصادفی تولید شده از توزیع وایبل و با استفاده از نمونه های زنجیر مارکوف مونت کارلو برآوردهای بیزی محاسبه و برای ساختن فاصله اطمینان باورمند و فاصله اطمینان پیشگویی از تکنیک نمونه گیری نقاط مهم استفاده شده است.
زیبا نوروزی مسعود یارمحمدی
توزیع وایبل توسط والدی وایبل در سال 1939 به عنوان مدل مناسب در مطالعات قابلیت اطمینان و مسائل مربوط به آزمون حیات از قبیل زمان شکست یا طول عمر یک محصول و یا واحد خاص، شناخته شد. توزیع های حاصل از ترکیب مولفه های دو توزیع یا بیشتر، «آمیخته» یا «مرکب» نامیده شده اند. توزیع آمیخته وایبل ترکیبی از دو پارامتر مقیاس و دو پارامتر شکل و یک پارامتر نسبت است. در سال های اخیر نگاه اجمالی به برخی از روش های محاسبه برآوردگرهای کارا از توزیع آمیخته شده است. یکی از این روش ها که برای برآورد پارامترهای توزیع آمیخته وایبل به کار گرفته می شود، استفاده از روش گشتاورهای نمونه است که پاول آر راید (1961) به آن پرداخته است. او ترکیب توزیع پوآسن، دو جمله ای و حالت خاصی از توزیع آمیخته وایبل را مورد بررسی قرار داد. روش گرافیکی برای برآورد پارامترهای توزیع آمیخته در آزمایش طول عمر لامپ های الکترونیکی، روش دیگری است که توسط اچ کی کاو (1959) انجام گرفته است. این پایان نامه به مقایسه روش های برآورد پارامترهای توزیع آمیخته وایبل به منظور یافتن بهترین و دقیق ترین برآوردگر از بین سه روش برآورد پارامتر (گشتاورهای نمونه، ماکسیمم درستنمایی و بیز) می پردازد. برای انجام این کار از شبیه سازی مونت کارلو مارکفی روی داده های تولید شده از توزیع وایبل با استفاده از نرم افزار مطلب7.1 و به کارگیری سه روش برآورد پارامتر برای توزیع آمیخته وایبل، استفاده شده است. بخش 2.1 و 3.1 از فصل یک این پایان نامه به تاریخچه و مفهوم توزیع وایبل و منشاء پیدایش آن اختصاص دارد. در بخش 4.1 شش تابع ریاضی مربوط به توابع طول عمر (تابع چگالی شکست، تابع توزیع شکست، تابع قابلیت اطمینان، تابع نرخ مخاطره، تابع نرخ مخاطره تجمعی و تابع میانگین عمر باقی مانده) معرفی شده است. در پایان فصل یک، مروری بر آنالیز وایبل و مزایای استفاده از این توزیع بیان شده است. در فصل دوم مدل های آمیخته متناهی و توزیع آمیخته را معرفی و نحوه ترکیب دو توزیع وایبل و ایجاد یک توزیع آمیخته وایبل با پنج پارامتر که شامل پارامتر آمیختگی (w) است، بیان شده است. سپس حالت های مختلف نمودار این تابع چگالی و نرخ مخاطره آن بررسی شده است و در پایان فصل به آماره های ترتیبی این توزیع اشاره و قضیه مربوطه نیز اثبات شده است. فصل سوم این پایان نامه که برآورگرهای کلاسیک توزیع آمیخته وایبل را شرح می دهد، شامل دو بخش است که بخش اول آن مربوط به برآورد پارامترها به روش گشتاورهای نمونه، و بخش دوم در خصوص برآورد پارامترهای توزیع به روش ماکسیمم درستنمایی است. فصل چهارم، به برآورد پنج پارامتر توزیع آمیخته وایبل به روش بیز، پرداخته است. در این فصل با در نظر گرفتن توزیع های پیشین مربوطه، برآورد پارامترهای توزیع انجام گرفته است. در فصل پنج، از معیار حداقل میانگین مربعات خطا (mse) جهت مقایسه این برآوردگرها استفاده شده است. که در جداول (5-1) و (5-2) ارائه شده اند. برای این منظور ابتدا با در نظر مقادیر مختلف برای پارامترهای توزیع های پیشین و استفاده از نرم افزار مطلب??? به شبیه سازی مونت کارلو مارکفی پرداخته شده است.
عصمت کریمی علی شادرخ
دراین پایان نامه به مطالعه ی برآوردگرهای پیش آزمون و پیش آزمون انقباضی برای پارامتر ضمانت و اختلاف این پارامتر در دو توزیع نمایی و انتخاب بهترین برآوردگر با توجه به اصل فرصت می-نیماکس خواهیم پرداخت.
ندا شاهین پور علی شادرخ
در این پایان نامه نخست الگوهای آماری تعمیم یافته برای چند توزیع معروف آماری شامل: توزیع نمایی، وایبل، پواسون و بتا معرفی می شود؛ سپس برآوردگر انقباضی را با استفاده از یک اطلاع پیشین و یک برآوردگر نااریب با کمترین واریانس تشکیل می دهیم. در ادامه کارایی نسبی این برآوردگر انقباضی را نسبت به برآوردگری با معیار کمترین میانگین مربعات خطا مقایسه می کنیم. نتایج نشان می دهد که برآوردگر انقباضی در بیشتر موارد از کارآیی بالاتری برخوردار است. در پایان برآوردگر انقباضی تعمیم یافته و برخی از خواص و ویژگی های آن، مورد بررسی قرار می گیرد.
شیرین شیرین جانی مسعود یارمحمدی
در مدل های رگرسیون خطی کلاسیک از کمینه کردن مجموع توان های دوم باقی خطا برای برازش مدل استفاده کرده و تابع میانگین شرطی را پیش بینی می کند. ولی این روش توان نمایش توزیع داده ها در سطوح مختلف متغیرمستقل را ندارد. یکی از راههای برطرف کردن این مشکل استفاده از مدل های رگرسیون چندک است که با برآورد تابع میانه ی شرطی وتعداد زیادی از توابع چندک شرطی امکان نمایش توزیع داده ها را مهیا می گردند. در این پایان نامه مدل های رگرسیون چندک ، روشهای برآورد پارامترهای آن معرفی می گردد.سپس نقاط موثر و نقاط دورافتاده و روش های شناسایی و کاهش اثرات این داده ها با استفاده از روش های استوار مورد بحث و بررسی قرار می گیرد. سپس انواع مشاهدات سانسور شده و مدل های رگرسیون چندک سانسور شده و استوار شده آن معرفی می شود. در ادامه با استفاده از روش های شبیه سازی برآورد تعمیم یافته کانکر و باست در حضور مشاهدات راست سانسور شده در متغیر پاسخ به ازای چندک های مختلف و برآورد به دست آمده از روش کمترین مربعات خطا مورد مقایسه قرار می گیرد.
ژیلا نوری پرویز نصیری
در این پایاننامه آماره های مرتب که نقش اساسی در نظریه قابلیت اعتماد ایفا می کنند، مورد بررسی قرار می گیرد. همچنین سیستم های منسجم، مقایسه ی طول عمر و ارائه راه هایی برای بهبود سیستم ها و اندازه های وابسته بین آماره مرتب و سیستم می پردازیم. براین اساس نیاز به برخی تعاریف پایه ای ازجمله سیستم های منسجم ، سیستم از ، تابع نرخ خطر، تابع بقاء، ترتیب تصادفی و تابع نشان می باشد که تابع نرخ خطر یک سیستم متشکل از مولفه با طول عمر و را تحت شرایط مختلف بررسی می کنیم. همچنین نشان می دهیم که مولفه های تشکیل دهنده سیستم از دارای خاصیت (نرخ خرابی صعودی) باشند، آن سیستم نیز است و کلاسی از سیستم منسجم که تحت بسته هستند را معرفی می کنیم و مقایسه طول عمر سیستم ها در حالتی که مولفه ها هم توزیع و مستقل یا هنگامی که تعویض پذیرند می پردازیم و همچنین متوسط و تصویر سیستم ها معرفی می شود و نشا ن می دهیم که آن ها می توانند ابزار مفید در مطالعه سیستم های منسجم با مولفه های غیر تعویض پذیر بوده و در تقریب نزدیک ترین سیستم به سیستم اصلی مفید می باشند .
صفیه غریب آبادی مسعود یارمحمدی
در این پایان نامه، برآورد ناپارامتری استوار برای رگرسیون فضایی مورد بحث و بررسی قرار می گیرد. به طور دقیق تر برای میدان تصادفی مانای اکید داده شد? ، یک خانواده از برآوردگرهای ناپارامتری استوار برای یک تابع رگرسیونی بر اساس روش هسته ای در نظر گرفته می شود. تحت برخی فرضیه های مرکب کلی سازگاری تقریبی و نرمال مجانبی برای این برآوردگرها بدست آورده و در ادامه یک روش استوار برای انتخاب پارامتر هموار جهت تطبیق که به داده های فضایی مورد بحث و بررسی قرار می گیرد.
احمد اسدی علی شادرخ
یکی از متداول ترین مباحث در آمار، مقایسه بین میانگین های دو جامعه ی نرمال، هنگامی که نسبت واریانس های آن ها نامعلوم بوده و برابر هم فرض نمی شود که به عنوان مسئله بئرنس-فیشر شناخته می شود. در پیشامد های تک متغیره روش های زیادی بر پایه توزیع تی استیودنت برای حل این مسئله وجود دارد. در پیشامدهای چند متغیره، بیشتر روش ها بر پایه تعدیل درجه آزادی برای بدست آوردن تقریب بهتری از توزیع کای اسکور یا هتلینگ می باشد. در هر دو حالت، راه حل های بیزی ارائه شده توسط برخی از محققان ارائه شده است. این کار با هدف ارائه راه حل محاسباتی بیزی برای مسئله بئرنس-فیشر بر پایه راه حل تحلیلی پیچیده ای از یوهانسن-ورهاندی انجام می پذیرد. برای ارزیابی عملکرد از طریق شبیه سازی مونت کارلو، خطاهای نوع اول و توان آزمون مورد محاسبه قرار می گیرد و با آزمون تعدیل نل و وندرمروه مقایسه می شود. استنباط ها به اختلاف میانگین های جامعه( ) از بردارهای میانگین ساخته می شوند. این به عنوان یک توزیع مزدوج پیشین برای بردار میانگین جامعه( ) و ماتریس کوواریانس جامعه( ) برای بدست آوردن توزیع پسین چند متغیره t از به ازای مورد استفاده قرار می گیرد. در این پایان نامه استنباط بیزی این مسئله مورد توجه می باشد. از آنجایی که نتایج حاصل از استنباط بیزی به طور قابل ملاحظه ای تحت تأثیر پیشین قرار دارد، توزیع های پیشین جفری و توزیع های پسین متناظر مورد مطالعه قرار می گیرد. در ادامه با شبیه سازی مونت کارلو توسط نرم افزار r روش محاسباتی برای حل مسئله بئرنس-فیشر چند متغیره توسط روش بیزی مورد بررسی قرار می گیرد.
حسین مرادی علی شادرخ
بسیای از داده های جمع آوری شده در زمینه علوم انسانی، علوم اجتماعی و بیولوژی دارای ساختار سلسله مراتبی هستن. بعنوان مثالی از این نوع می توان به ترکیب تعداد فرزندان در بین خانواده ها اشاره کرد که به صورت سلسله مراتبی است، به این ترتیب که فرزندان در سطح 1 و خانواده ها در سطح 2 قرار می گیرند. در نتیجه چون بین اعضای هر خانواده همبستگی وجود دارد تحلیل داده ها بدون در نظر گرفتن این همبستگی به نتایج نادرستی منجر می شود.روشهای قابل استفاده شامل ماکسیمم درستنمایی، توان دوم تعمیم یافته و روشهای بوت استرپ پارامتری و بوت استرپ ناپارامتری است که در این پایان نامه مورد بررسی قرار می گیرند.
الناز نوری پرویز نصیری
برآورد پارامترها و جمله¬ی خطا در رگرسیون همواره مورد بحث بوده و ارائه برآوردگرهایی با خواصی مطلوب همچون کارایی و نااریبی از اهمیت بالایی برخوردار می¬باشد. در واقع در بسیاری از برنامه¬های کاربردی استفاده از اندازه¬ی خطاهای نسبی بجای خطا از نگرانی¬های اصلی کاربران بوده و محققان ، همواره در جستجوی راهی برای کاهش این خطاها و ارائه¬ی برآوردهایی بهتر و کاراتر هستند. در این پایان نامه برای مدلی ویژه از رگرسیون غیر خطی (مدل ضربی) ، برآوردی را به عنوان جایگزین مناسبی برای برآوردهای قدیمی با توجه به مینیمم کردن حداقل خطاهای نسبی مطلق ارائه می¬دهیم. این شیوه¬ی برآورد را معیار lare ( حداقل خطای نسبی مطلق ) نامیده و نشان می¬دهیم با شرایطی خاص ، این روش از کارایی بالاتری در مقایسه با روشهای قدیمی برخوردار است. مزیت مهمی که این روش بر دیگر روشها دارد آن است که در مقیاس یا واحد آزاد می¬باشد که این موضوع در برخی از انواع داده¬ها همچون تحلیل رگرسیون سهام کاربرد گسترده¬ای دارد. در واقع معیار lare یک ابزار اصلی مورد استفاده توسط تحلیل¬گران مالی و سرمایه¬گذاری می¬باشد. علاوه بر آن در علومی همچون پزشکی و مطالعات زیستی نیز کاربرد وسیعی دارد .
ساروز رضایی مسعود یارمحمدی
وجود تغییرات ساختاری در سریهای زمانی مالی از عواملی است که موجب میشود مدلهای خطی برای تحلیل این سریها مناسب نباشند. نادیده گرفتن این تغییرات در سطح میانگین و واریانس سریهای زمانی اثرات نامطلوبی روی تحلیلها خواهد گذاشت. در بسیاری از سریهای زمانی مالی و اقتصادی فرض ثابت بودن واریانس برقرار نیست که در این شرایط مدلهای خانواده اتورگرسیو ناهمواریانس شرطی میتوانن نتایج مطلوبی ارائه دهند. در این تحقیق مدلهای arch و garch و egarch و tgarch و agarch معرفی میشوند. سپس برآورد پارامترها ، پیشبینی ، نیکویی برازش ، آزمون نرمال بودن آزمون arch و معیارهای تشخیص مرتبه مدل معرفی میشوند. در پایان کاربرد این روشها بر روی دادههای روزانه بورس اوراق بهادار تهران از 7 فروردین 1389 تا 22 اسفند 1390 مقایسه میشود.
حمید اسکندری پرویز نصیری
در این پژوهش دسته ای از برآورد گرها به نام برآوردگرهای بیزی مقید معرفی می شوند با در نظر گرفتن زیر خانواده توضیح های نمایی طبیعی با واریانس درجه دوم برآوردگر بیزی تجربی مقید و بیزی سلسله مراتبی مقید محاسبه می شود که برآورد گر بیزی مقید بردار پارامتر نامعلوم تتا تخت تابع زیان مجموع توانها دوم تتای موزون و متعادل و متعادل موزون را به دست می آوریم.
سمیه السادات منتظری مسعود یارمحمدی
pca می تواند برای کاهش ابعاد داده مورد استفاد قرار بگیرد، به این ترتیب مولفه هایی از مجموعه داده را که بیشترین تأثیر در واریانس را دارند حفظ می کند. متأسفانه واریانس کلاسیک (که ماکزیمم می شود) و ماتریس کوواریانس کلاسیک (که تجزیه می شود) هر دو نسبت به دورافتاده ها یعنی مشاهداتی که از الگوی اکثریت داده ها پیروی نمی کنند، بسیار حساس اند. در نتیجه، اولین مولفه ها اغلب جذب نقاط دورافتاده می شوند، و ممکن است تغییرات مشاهدات عادی را ثبت نکنند. بنابراین، کاهش داده ها بر اساس pca کلاسیک (cpca) با وجود دورافتاده ها غیر واقعی می شود. به منظور مقاومت در مقابل نقاط دورافتاده به دنبال روش هایی هستیم که نسبت به این نقاط حساسیت کمتری دارند، این روش ها را روش های استوار می نامند. ساده ترین روش برای استوارسازی pca کلاسیک جایگزین کردن ماتریس کوواریانس نمونه ای با ماتریس کوواریانس استوار است . روش دیگری که برای تحلیل مولفه های اصلی استوار به کار می رود روش تعقیب تصویراست، به طور کلی این روش در جستجوی جهتی است که در آن مشاهدات تصویر شده بزرگترین مقیاس استوار را دارد. هوبرت و همکاران (2005) با ترکیب مز ایای روش های جایگزین کردن ماتریس کوواریانس نمونه ای با ماتریس کوواریانس استوار و تعقیب تصویر، الگوریتم سریعی برای تحلیل مولفه های استوار ارائه کرده اند. بدین صورت که ابتدا روش جستجوی تصویر را برای کاهش بعد به کار برده و سپس ایده برآوردگر کوواریانس استوار (mcd) را برای داده هایی که بعد آنها کاهش یافته است، استفاده می کنند. الگوریتم robpca روش pca استوار که آن را robpca می نامیم ترکیبی از عقیده ی تعقیب تصویر و برآورد کوواریانس استوار است، این روش در صورتی که داده ها از توزیع نرمال تولید شده باشند و در نتیجه متقارن باشند مورد استفاده قرار می گیرد. روش robpca ایده های تعقیب تصویر و برآورد کوواریانس استوار را ترکیب می کند. بخش تعقیب تصویر برای کاهش بعد اولیه استفاده می شود. سپس برخی ایده های برآوردگر mcd در این فضای داده ی کم بعد تر به کار می رود. روش ترکیبی برآورد های استوار تری از الگوریتم تعقیب تصویر اولیه فراهم می کند. این الگوریتم مرکب از قدم های زیر است: مرحله 1- ابتدا داده ها با کاهش فضای داده هایشان به زیرفضای تولید شده به وسیله n مشاهده، پیش پردازش می شوند . این امر به وسیله تجزیه مقدار تکین ماتریس داده مرکزی شده، اجرا می شود که به طور قطع لازم نیست، اما وقتی تعداد متغیرها از تعداد مشاهداتی که آنها قبلاً یک بعد بزرگ را نتیجه می داده اند تجاوز کند محدود می شود بدون اینکه اطلاعاتی را از دست بدهد. x_(n,p)-1_n ? ?_0^=u_(nr_0 ) d_(r_0 r_0 ) v_(r_0 p) به طوری که ? ?_0 بردار میانگین کلاسیک، r_0=rank(x_(n,p)-1_n ? ?_0^) ، d ماتریس قطری r_0×r_0 و u^ u=i_(r_0 )=vv ، وقتی i_(r_0 ) ماتریس همانی r_0×r_0 می باشند. اکنون بدون از دست دادن کلیت، روی زیرفضای تولید شده به وسیلهr_0 ستون ماتریس v کار می شود. یعنی، z_(n,r_0 )=ud ماتریس داده جدید می شود. لازم به ذکر است که این تجزیه مقدار تکین تنها تبدیل افاین داده ها است مرحله 2- انتخاب مقدار پوششی 1/2<?<1 (به طور قراردادی ?=0.75 ) و h=[?n] ، ? کمتر robpca استوارتر اما با دقت کمتر خواهد بود. مرحله 3- برای هر نقطه ی داده ای x_i (یک سطر x ) دورافتادگی استاهل-دانهو را به صورت زیر معرفی می کنیم: outl(x_i,x)=sup?v?b??|?x?_i v-m(?x?_j v)|/(s(?x?_j v))? که m(.) و s(.) برآوردگرهای mcd استوار تک متغیری مکان و مقیاس هستند و b یک مجموعه از 250 جهت تصادفی در بین دو نقطه ی داده ای است. پس مجموعه ی i_h را از h نقطه ی داده ای با کمترین دورافتادگی در نظر می گیریم، و ماتریس میانگین و کوواریانس آن را محاسبه می کنیم. µ ?_0 (x)=1/h ?_(i?i_h)?x_i ?_0^^??(x)?=1/(h-1) ?_(i?i_h)??(x_i ?-µ ?_0 (x))(x_i-? ?_0 (x)) مرحله 4 - k بردار ویژه ی نخست از برآوردگر ماتریس کوواریانس ? ?_0 را که در قدم سوم به دست آمد انتخاب می کنیم. (تعداد مولفه ها، k، می تواند به چندین روش نظیر، توجه به نمودار scree ، که نمودار مقادیرویژه است، یا استفاده از معیارهای انتخاب (?_(j=1)^k?? ?_j )/(?_(j=1)^r?? ?_j )?90? یا ? ?_k/? ?_1 ?10^(-3) تعیین کرد. همه ی داده ها را روی زیر فضای k بعدی v_0 ،که با استفاده از k بردار ویژه نخست از برآوردگر کوواریانس استوار ? ?_0 به دست آمده است، تصویر می کنیم. مرحله 5- برای هر مشاهده فاصله ی قائم زیر را محاسبه می کنیم. od_i^((0))=?x_i-x ?_(i,k) ? که در آن x ?_(i,k) تصویر x_i روی زیر فضای v_0 است. ماتریس کوواریانس تمام مشاهدات x_i که برای آن od_i^((0))?c_od را به عنوان ? ?_1 در نظر می گیریم. با استفاده از k بردار ویژه ی نخست از ? ?_1 ، زیر فضای اصلاح شده ی v_1 را پوشش می دهیم. تعیین مقدار میان بر c_od کاری دشوار است، زیرا توزیع فاصله ی قائم به طور کلی معلوم نیست. در robpca مقرر شده که فاصله ی قائم به توان 2/3 به طور تقریبی به صورت نرمال توزیع شده است. پس c_od=?(? ?+? ? z_0.975)?^(3/2) ? ?و ? ? با استفاده از برآوردگرهای mcd تک متغیری برآورد می شوند و z_0.975 چارک 0.975 از توزیع نرمال است. در این مرحله، همه ی نقاط را روی زیر فضای v_1 تصویر می کنیم. مرحله 6- در این زیر فضای k بعدی یک مرکز و ماتریس کوواریانس استوار را به کمک برآوردگر های mcd بازموزون به داده های تصویر شده، محاسبه می کنیم. این برآوردگر با استفاده از الگوریتم تقریبی fast-mcd محاسبه می شوند. مولفه های اصلی نهایی بردارهای ویژه از این ماتریس کوواریانس استوار هستند. الگوی دورافتاده ها به جز محاسبه مولفه های اصلی، robpca نقاط دور افتاده را نیز مشخص می کند. به طور کلی یک نقطه دور افتاده مشاهده ای است که از الگوی اکثریت داده ها پیروی نمی کند. با این مفهوم pca سه نوع از دور افتاده ها را می تواند مشخص کند. نقاط نافذ خوب: نقاطی که نزدیک به زیر فضای pca اما دور از مشاهدات عادی قرار می گیرند. دور افتاده های متعامد: مشاهداتی که فاصله متعامد زیادی با زیر فضای pca دارند در حالیکه تصویرشان روی فضای pca قرار می گیرد. نقاط نافذ بد: مشاهداتی که فاصله متعامد زیادی از فضای pca دارند و تصویرشان روی فضای pca دور از مشاهدات عادی قرار می گیرد. برای تشخیص مشاهدات عادی از سه نوع دورافتاده برای داده هایی با بعد بالا، نمودار تشخیصی یا الگوی دورافتاده رسم می شود .روی محور عمودی نمودار تشخیصی فاصله متعامد، od_i، روی محور افقی فاصله امتیاز استوار، ?sd?_i هر مشاهده که به صورت زیر است رسم می شود: ?sd?_i= ?(?_(j=1)^k?(t_ij^2)/? ?_j ) به طوری که امتیازهای t_ij^2 از رابطه t_(n,k)=(x_(n,p)-1_n ? ?^ ) p_(p,k) به دست می آیند. فواصل متعامد در مقابل فواصل امتیاز استوار رسم می شوند، خطوط رسم شده برای تشخیص در بین مشاهدات با od کوچک یا بزرگ و همچنین برای تشخیص sd کوچک یا بزرگ است. دو خط برش رسم می شود. نقطه برش روی محور افقی ?(?_(k,0.975)^2 ) وقتی k>1 و ±?(?_(k,0.975)^2 ) وقتی k=1 می باشد (زیرا مربع فواصل ماهالانوبیس امتیازهای به طور نرمال توزیع شده، به طور تقریبی دارای توزیع ?_k^2 اند). تشخیص برش روی محور عمودی دشوارتر است، زیرا توزیع فواصل متعامد دقیقاً شناخته شده نیست. تشخیص دور افتاده ها برای داده های عادی و چوله چندین قانون برای مشخص کردن نقاط دورافتاده در داده ها است که بر اساس فواصل مختلف یا معیارهای دورافتادگی در هر نقطه داده ای محاسبه می شوند. این قوانین رد متناظر است با مشخص کردن همه نقاطی که دورافتادگی آنها از یک مقدار برش مشخص تجاوز می کند. نخستین قانون رد که آن را با نماد rr[rd] نمایش می دهیم، از فاصله استوار در بین هر نقطه و مرکز ابر داده ها استفاده می کند. rd_i=?((x_i-?)^ ?^(-1) (x_i-?) ) i=1,2,…,n در این فاصله به جای ?، ? از برآوردگر های مکان و پراکندگی ماتریس کوواریانس با کمترین دترمینان (mcd) استفاده می کنیم، که در نتیجه یک فاصله استوار داریم که از دورافتاده های ممکن تأثیر نمی پذیرند. مجذور فاصله rd_i به طور تقریبی دارای توزیع?^2 با p درجه آزادی است، پس هر مشاهده ای که rd_i بزرگی دارد، را می توان به عنوان یک مشاهده ی دور افتاده در نظر گرفت. دومین قانون رد بر اساس معیار دورافتادگی استاهل- دانهو است که با rr[sd] نمایش داده می شود و به صورت زیر تعریف می شود. outl(x_i,x)=max?(v?b)??|?x^?_i v-med_j (?x^?_j v)|/(mad_k (?x^?_j v) )? مجموعه b شامل تمام جهاتی است که در بین دو نقطه داده ای که به صورت تصادفی از بین n نقطه انتخاب شده اند، وجود دارد. به منظور کاهش زمان محاسبات تنها 250 جهت را تولید می کنیم. مجذور این فاصله نیز به طور تقریبی دارای توزیع?^2 با p درجه آزادی است. به دنبال یک توزیع نرمال چند متغیره، یا حداقل یک توزیع بیضوی هر دو روش rr[sd] و rr[rd] زمانی مناسبند که داده ها غیر آلوده اند (دور افتاده نیستند)، این قوانین وقتی داده ها از توزیع چوله بیایند نقاط زیادی را به غلط به عنوان نقطه دور افتاده مشخص می کنند، به این دلیل ترجیح می دهیم از قوانینی استفاده کنیم که فرض تقارن را برای توزیع در نظر نمی گیرد که در این صورت برای داده های چوله نیز مناسب است. بنابراین روش rr[sd] را با استفاده از نتایج نمودار جعبه ای تعدیل یافته تنظیم می کنیم. سومین قانون رد که با اصلاح قانون رد rr[sd] با استفاده از نمودار جعبه ای تعدیل یافته به دست آمده را با نماد rr[ao] نمایش می دهیم. در اینجا با توجه به فاصله [c_1,c_2 ]، که c_1 متناظر است با کوچکترین مشاهده که بلافاصله بزرگ تر است از q_1-1.5e^(-4mc) iqr و c_2 متناظر با بزرگ ترین مشاهده که بلافاصله کوچکتر از q_3+1.5e^3mc iqr است، دورافتادگی تعدیل یافته (ao) که مخرجی متفاوت از روش rr[sd] دارد به صورت زیر تعریف می شود: ao_i=?max?_v?b |?x?_i v-med(?x?_j v)|/((c_2 (v)-med(?x^?_j v))i[?x^?_i v>med(?x^?_j v)]+(med(?x^?_j v)-c_1 (v))i[?x^?_i v<med(?x^?_j v)]) q_1و q_3 چارک اول و سوم از ?x^?_i v است و iqr و mc به طور مشابه محاسبه می شوند، c_1 (v) و c_2 (v) فواصل در نمودار جعبه ای تعدیل یافته اند که با توجه به مقدار mc انتخاب می شوند. مقدار ao_i برای جهات v و –v یکسان است که در این صورت زمان محاسبه را نصف می کند. در این فرمول فرض می کنیم که mc?0 است، در غیر این صورت v را با –v جایگزین می کنیم. اگر در این مقیاس دورافتادگی، توزیع چوله به راست باشد، نتیجه می دهد که مقدار برش برابر با است: cutoff=q_3+1.5e^4mc iqr الگوریتم اصلاح شده برای داده های چوله الگوریتم robpca زمانی مناسب است که داده های اصلی متقارن باشند، و از توزیع نرمال تولید شده باشند. اگر داده های اصلی چوله باشند، نقاط زیادی در این الگوریتم تمایل دارند که به عنوان نقطه ی دورافتاده مطرح شوند، در حالی که واقعاً چنین نیستند. به منظور رفع این مشکل الگوریتم جدیدی را با عنوان robpca اصلاح شده مطرح می کنیم. این الگوریتم شامل همان گام های الگوریتم robpca است که سه اصلاحیه در آن انجام داده ایم. دورافتادگی استاهل-دانهو در گام سوم الگوریتم بایک مقیاس جدید جایگزین می شود، که دورافتادگی تعدیل یافته نامیده می شود. این معیار، برای هر مشاهده یک اندازه ای از دورافتادگی تعیین می کند که به وسیله ی روش تعقیب تصویر و همچنین نمودار جعبه ای تعدیل یافته به دست آورده می شود. دورافتادگی تعدیل یافته مخرج متفاوتی از دورافتادگی استاهل-دانهو دارد که به منظور مشخص شدن نقاط داده ای کمتر به عنوان نقطه ی دورافتاده در توزیع چوله است. این معیار به صورت ذیل است: ao_i=max?v?b??|?x?_i v-med(?x?_j v)|/((c_2 (v)-med(?x^?_j v))i[?x^?_i v>med(?x^?_j v)]+(med(?x^?_j v)-c_1 (v))i[?x^?_i v<med(?x^?_j v)])? که c_1 متناظر است با کوچک ترین مشاهده ای که بزرگ تر است از q_1-1.5e^(-4mc) iqr و c_2 متناظر است با بزرگ ترین مشاهده ای که کوچک تر است از q_3+1.5e^3mc iqr. در اینجا q_1 و q_3 اولین و سومین چارک داده های تصویر شده می باشد، iqr=q_3-q_1 و mc میانه ی دو گانه، یک معیار استوار چولگی می باشد. این فرمول فرض می کند که mc?0 است، در غیر اینصورت ما v را با –v جایگزین می کنیم. اصلاحیه دوم مربوط به مقدار میان بر برای فواصل متعامد od در گام پنجم است. ما حالا استفاده می کنیم به عنوان مقدار میان بزرگترین od_i کوچکتر از q_3 ({od})+1.5e^3mc({od}) iqr{od}). با انجام این کار داده ها بیش از این لازم نیست که تبدیل بشوند، و حال بیشتر مقدار میان بر وابسته به خود داده ها به جای بعضی مقادیر تفکیک شده است. اصلاحیه سوم در گام 6 اتفاق می افتد. به جای استفاده از برآوردگر های mcd بازموزون، ما دورافتاده های تعدیل شده در زیر فضای k بعدی v_1، را محاسبه می کنیم و ماتریس میانگین و کوواریانس از h نقطه با کمترین دورافتاده های تعدیل شده را نیز محاسبه می کنیم. شبیه سازی با استفاده از کتابخانه ی libra از نرم افزار matlab انجام می شود. شبیه سازی نشان می دهد که با هر درصد از آلودگی robpca اصلاح شده، زمانی که داده ها نامتقارن باشند نتایج بهتری از سایر روشها دارد. و robpca اصلاح شده و معمولی در حالی داده ها متقارن باشند نتایج تقریبا یکسانی دارد.
مسعود یارمحمدی مریم میرزا آقایان
ترکیبات آکریدین دی اونی یکی از قدیمی ترین و موفق ترین دسته از مواد فعال زیستی هستند و به صورت گسترده در ساخت داروهای ضد مالاریا، ضد باکتری و ضد سرطان مورد استفاده قرار گرفته اند. این ترکیبات از مشتقات آکریدینی هستند که دارای ساختاری با سه حلقه مسطح می باشند که دارای توانایی وارد شدن به ساختار دئوکسی ریبو نوکلئیک اسید به صورت برگشت پذیر هستند. کالیکس[4]آرن ها از دسته ماکروسیکل های حلقوی هستند که می توانند با عامل دار شدن، به صورت گسترده در سنتز های مختلف مورد استفاده قرار گیرند. در این پایان نامه روش جدیدی برای سنتز ترکیبات جدید آکریدین دی اون کالیکس[4]آرن 49، 50 و 51 بوسیله واکنش چند جزیی میان کالیکس[4]آرن مونو آمینه 44 با دیمدون و 4- برومو-بنزآلدهید ویا 3- هیدروکسی-بنزآلدهید در حضور هتروپلی اسید به عنوان کاتالیزور مورد استفاده قرار گرفته است. ترکیب 49 با بهره 50%، ترکیب 50 با بهره 46% و ترکیب 51 با بهره 40% جداسازی شد و بوسیله دستگاه رزونانس مغناطیسی هسته پروتون، رزونانس مغناطیسی هسته کربن و دستگاه طیف سنجی جرمی با وضوح بالا مورد شناسایی قرارگرفت. مطالعات ما در رابطه با تمایل اتصال ترکیبات آکریدین دی اون کالیکس[4]آرن 49، 50 و 51 به مولکول دئوکسی ریبونوکلئیک اسید نشان داد که این ترکیبات تمایل خوبی به ایجاد پیوند با دئوکسی رییبونوکلئیک اسید دارند.
زهرا محمدی مسعود یارمحمدی
چکیده تحلیل مجموعه مقادیر تکین چند متغیره ((mssa یکی از روشهای ناپارامتری برای تحلیل سریهای زمانی چند متغیره بوده و نظیر حالت یک متغیره (ssa) شامل دو مرحله تجزیه و بازسازی است . در مرحله تجزیه هر متغیر که یک سری زمانی می باشد، به طور جداگانه به چند مولفه قابل تفسیر همچون روند، مولفه نوسانی و نوفه تجزیه شده و بعد از گروهبندی مناسب، مولفه های بازسازی شده مربوط به هر سری در یک ماتریس معین، درست به همان ترتیب و چیدمان قبل از تجزیه در کنار هم قرار می گیرند. به این ترتیب مولفه های بازسازی شده برای پیش بینی مشاهدات جدید مربوط به هر سری مورد استفاده قرار می گیرند. روش mssa به مانند ssa به انتخاب دو پارامتر اساسی طول پنجره و پارامتر ساختاری مرتبط با نحوه گروهبندی بستگی دارد. در این تحقیق پس از معرفی تحلیل مجموعه مقادیر تکین یک متغیره (ssa) و نحوه تعیین پارامترهای آن، به تعمیم آن به حالت چند متغیره می پردازیم. در ادامه دو الگوریتم پیش بینی برداری و بازگشتی در حالت چند متغیره مورد بحث و بررسی قرار می گیرد. سپس با استفاده از روشهای شبیه سازی ، بررسی روشهای مختلف پیش بینی mssa صورت گرفته و با استفاده از کاربرد این روش بر روی مجموعه داده های واقعی به ارزیابی و مقایسه روش mssa با روش الگوی اتورگرسیو با وقفه های توزیع شده ardl پرداخته می شود. کلید واژه : تحلیل مجموعه مقادیر تکین ، تجزیه مقدار ویژه، ماتریس هنکل، گروهبندی
نازلی جعفری پرویز نصیری
این پایان نامه شامل دو بحث اصلی در رابطه با برآورد بیزی در صورت وجود نقطه تغییر برای دنباله ای از مشاهدات مستقل x1,x2,…,xm,xm+1,…,xn، که m بیانگر نقطه تغییر بوده و m=1,2,…n-1 می باشد، ابتدا برآورد بیزی تابع بقا را تحت توزیع احتمال خانواده نمایی یک پارامتری، برای توزیع های نرمال، گاما و پارتو را بررسی شده است، سپس برآورد بیزی پارامترهای قبل و بعد از نقطه تغییر معلوم، برای توابع زیان متقارن و نامتقارن برای توزیع های پواسن و هندسی محاسبه شده است. حساسیت تحلیل برآوردگرهای بیزی با استفاده از روش های شبیه سازی در نرم افزار آماری r ، مورد بحث و بررسی قرار گرفته شده است.
فاطمه حیدری مسعود یارمحمدی
در این تحقیق اثر کاهش اغتشاش بر روی معیار وابستگی خطی و غیرخطی در سریهای زمانی مالی بررسی می شود. همچنین روش تحلیل مقادیر ویژه منفرد را به عنوان یک روش صافی در سریهای زمانی مالی معرفی کرده و نتایج مربوط به این روش با نتایج بدست آمده ازمدلهای arma وgarch به عنوان روشهای خطی و غیرخطی برای صافی نمودن سریهای زمانی بررسی می شود. در ادامه کاربرد روشهای مذکور برای داده های شبیه سازی شده مورد مقایسه قرار می گیرد.
آرزو فرزادمنش پرویز نصیری
مدل رگرسیون لجستیک یکی از مهم ترین مدل های خطی تعمیم یافته است که برای تحلیل مدل های چند متغیره کاربرد دارد به طوری که تمامی عوامل پیش بینی کننده موجود در یک مساله را به طور همزمان مورد توجه قرار می دهد. این مدل برای پیش بینی مدل های خطی و غیرخطی مناسب هستنداز سوی دیگر شبکه های عصبی به دلیل قابلیت های منحصر به فردشان ابزار بسیار کارایی برای پیش بینی می باشند. این مدل ها از اطلاعات پیشین استفاده نموده و رفتار آینده آنرا پیش بینی می نمایند.بنابراین جهت تحلیل موضوع مثالهایی در این زمینه ارائه شده و نتایج پیش بینی بیانگر آن است که شبکه عصبی مصنوعی توانسته با دقت بیشتری نتایج را نسبت به رگرسیون لجستیک پیش بینی نماید.
سعید حیدری مهترلو پرویز نصیری
هدف اصلی این پایان نامه،برآورد (r= p(y<x،زمانی که x و y دو متغیر تصادفی از توزیع وایبل نمایی شده هستند میباشد که شامل دو پارامتر شکل و یک پارامتر مقیاسی دارد و خانواده وایبل و خانواده نمایی نمایی شده،به عنوان موارد خاصی از این خانواده، در نظر گرفته شده اند. با توجه به اهمیت توزیع وایببل نمایی شده،در این پایان نامه،ابتدا به معرفی این توزیع و بیان ویژگی های آن میپردازیم و به دنبال آن ، درآمدی بر بوت استراپ و نیز مدل بر مدل تنش – مقاومت واهیم داشت.سپس مساله ی برآورد r را برای این توزیع به روش بوت استراپ مطرح میکنیم که برای اولین بار ارائه شده است. و در پایان ضمن بررسی روشهای برآورد ، برآورد گر کارا با توجه به ملاک میانگین مربع خطا ارایه میشود.با توجه به نتایج بدست آمده روش بازنمونه گیری خودگردان در موارد مورد بررسی کارایی بهتری دارد
ندا صبوری مسعود یارمحمدی
در این تحقیق تأثیر نقاط دورافتاده در شناسایی ناهم واریانسی شرطی و برآورد مدل های تعمیم یافته ی اتورگرسیو ناهم وایانس شرطی (garch) مورد بررسی قرار می گیرد. نخست، تقریب اریبی تابع خودهمبستگی نمونه ای مربوط به توان دوم مشاهدات، تولید شده به وسیله فرآیندهای مانا، به دست آمده و نشان می دهیم که خواص آزمون های هم واریانس شرطی به دلیل وجود نقاط دورافتاده متأثر می گردد. سپس، تقریب اریبی های نمونه ای متناهی برآوردگر حداقل مربعات معمولی (ols) برای مدل های arch(p) به دست می آید. نتایج نمونه ای متناهی به برآوردگرهای تعمیم یافته ی حداقل مربعات (gls) و ماکسیمم درستنمایی (ml) مربوط به مدل های arch(p) و garch(1,1) ، تعمیم می یابد.
لاله صالحی مسعود یارمحمدی
خوشه بندی یکی از روش های اصلی تحلیل داده است. از این روش به صورت گسترده ای برای تشخیص الگو، استخراج ویژگی ها، مجزا سازی تصاویر، تخمین تابع و داده کاوی استفاده می شود. خوشه بندی به عنوان یک روش دسته بندی غیر نظارتی، برخی از ساختارهای ذاتی موجود در مجموعه ای از اشیاء را بر اساس تشابه در سنجش مشخص می کند . در این پایان نامه مفهوم های اساسی مرتبط با خوشه بندی، روش های خوشه بندی سلسله مراتبی تقسیمی و تجمعی، خوشه بندی فازی و خوشه بندی با استفاده از شبکه عصبی مصنوعی بیان شده است. سپس تحلیل خوشه بندی با استفاده ازشبکه عصبی مصنوعی و کاربرد واجرای آن را در نرم افزار مت لب، برای تجزیه و تحلیل مربوط به داده های واقعی شامل داده های مربوط به مسکن و سلول های سرطانی مورد بحث و بررسی قرار داده ایم. در نهایت به این نتیجه رسیدیم که بین روش های ذکر شده، روش خوشه بندی با استفاده از شبکه عصبی مصنوعی و اجرای آن در نرم افزار مت لب، بهترین روش پردازش داده ها با حجم بالا، برای رسیدن به یک نتیجه ی مطمئن می باشد. کلمات کلیدی : خوشه بندی، تحلیل خوشه ای، شبکه های عصبی مصنوعی، نرم افزار مت لب
شهره اصغری مقدم مسعود یارمحمدی
روش¬های پیش بینی سری های زمانی مالی براساس مدل¬های اتورگرسیو میانگین متحرک انباشته (arima) و واریانس ناهمسان شرطی اتورگرسیو (arch) ویژگی حافظه بلند¬مدت و وجود شکست¬های ساختاری را در مدل¬سازی در نظر نمی¬گیرند. جهت رفع مشکل حافظه بلند¬مدت از فرآیندهایی نظیر مدل اتورگرسیو میانگین متحرک انباشته کسری (arfima) و مدل واریانس ناهمسان شرطی اتورگرسیو تعمیم یافته انباشته کسری (figarch) استفاده می¬شود. ولی این فرآیندها هنوز نسبت به شکست¬های ساختاری حساس می¬باشند. جهت برخورد با این مسأله، مدل اتورگرسیو میانگین متحرک انباشته کسری تطبیقی (a-arfima) را در نظر می¬گیریم. این مدل یک نمایش مناسب از شکست های ساختاری را ارائه داده و می توان آن را با استفاده از روش شبه حداکثر درستنمایی (qmle) به صورت کارآمد برآورد نمود. در ادامه با استفاده از روش¬های شبیه-سازی نخست اثربخشی qmle، برای برآورد مدل a-arfima در نمونه¬های اندازه کوچک و متوسط و برای سودمندی مدل a-arfima برای بررسی صورت غیر¬خطی و تغییر ساختاری مورد بحث و بررسی قرار گرفته و سپس برای بررسی خطای پیش¬بینی، سری¬های زمانی را براساس مدل¬¬های arfima و a-arfima شبیه¬سازی کرده¬ایم. همچنین از این مدل¬ها جهت تحلیل داده¬های تورم ماهیانه خانوارهای شهری ایران از اردیبهشت سال 1381 تا دی سال 1392 استفاده می¬کنیم.
ابراهیم جهانگیری علی شادرخ
جهت بررسی استقلال بین دو سری زمانی آزمون های متفاوتی ارائه شده است. در این پایان نامه یک روش آزمون استقلال میان دو سری زمانی معرفی میکنیم. این آزمون که یک آزمون جایگشتی است با کدگذاری روی هر سررری انجام می شررود. این آزمون را میتوان به کمک جدول توافقی به وسرری ه آمارههای رایج مخت فی مانند خی دو پیرسون یا نسبت درستنمایی، انجام داد. سپس، با در نظر گرفتن ویژگی های هر آ ماره و د قت آن برای مجمو عه داده های مخت ف، ابزار های مخت فی برای آزمون ا ستقلال ارائه میکنیم. این آزمونهای معمولی، محا سبه سریعتری دارند و برای آزمون ا ستقلال یک دامنه بزرگ از سریهای دادههای مناسب میباشند. همچنین نشان میدهیم که چرا وجود یک آزمون دقیق لازم و ضرررروری اسرررت. در این التها، کاربرد روشهای مونت کارلو برای برآورد p -مقدار دقیق پیشنهاد شده است. دادههای قیقی و داده های شبیهسازی شده )که نرخهای تبادل میان چندین فعالیت رایج را برمیگردانند( ظرفیت این آزمون را برای ت شخیص واب ستگیهای خطی و یا غیرخطی مشخص میکند.
احمد موسوی پرویز نصیری
توزیع وایبول و انواع مدل¬های آن برای توصیف انواع مختلف شکست¬های مشاهده شده اجزاء و پدیده¬ها به¬کارمی-روند. این مدل¬ها به طور فراوان در تحلیل قابلیت اعتماد و بقا مورد استفادهمی¬باشند. به همین دلیل بیش از نیم قرن است که توزیع وایبل توجه آماردانان را به خوبی در کاربردهای متفاوت آماری به خود جلب کرده است.در این پایان¬نامه هدف بررسی توزیع وایبل و معکوس آن است تا در انتها به شرح یکی از پرکاربردترین انواع توزیع وایبل معکوس، یعنی توزیع وایبل معکوس آمیخته بپردازیم. با توجه به اهمیت توزیع وایبل معکوس آمیخته در علوم کاربردی، به برآورد پارامترهای این توزیع نیاز اساسی وجود دارد اما از آنجایی که برآورد حداکثر درستنمایی پارامترهای این توزیع تابعی غیرخطی و پیچیده¬ای ایجاد می¬کند لاجرم از روشهای عددی برای برآورد آن استفاده می-کنیم.
اشرف کاظمی بایقوت مسعود یارمحمدی
در این پایان نامه برآورد پارامتر مقیاس توزیع نمایی تحت تابع زیان متقارن مربع خطا و تابع زیان نامتقارن لاینکس مورد بررسی قرار می گیرد. در ادامه ضمن ارائه روش های برآوردگر بیز، برآوردگر انقباضی و برآوردگر درستنمایی ماکزیمم اقدام به برآورد پارامتر مقیاس توزیع نمایی تحت تابع زیان مربع خطا و همچنین تابع زیان لاینکس خواهد شد، که هدف اصلی این پایان نامه می باشد. در پایان روش های برآوردگر برای پارامتر، برآوردگر با استفاده از شبیه سازی اقدام می شوند.
سکینه یعقوبی مسعود یارمحمدی
همبستگی بین مشاهدات در زمان های متفاوت در سری های زمانی، حافظه نامیده شده و اغلب بوسیله تابع خودهمبستگی اندازه گیری می شود. حافظه بلند مدت بدین معناست که مشاهدات با فاصله زیاد از هم، مانند مشاهدات نزدیک به هم، دارای وابستگی شدیدی می باشند. تابع خودهمبستگی فرآیندهای با حافظه بلند مدت به آرامی با نرخ هیپربولیک کاهش می یابد در حالی که این کاهش در فرآیندهای با حافظه کوتاه مدت به صورت نمایی است. در سال های اخیر مدل های اتورگرسیو میانگین متحرک تلفیق یافته کسری (arfima) به منظور تحلیل فرآیندهای با حافظه بلند مدت معرفی شده است که این مدل ها علیرغم مطلوبیت در برطرف کردن مشکل نامانایی در میانگین، به عنوان مدل هایی جهت برطرف نمودن نامانایی در میانگین و واریانس به طور همزمان کارا نمی باشند. به منظور برطرف کردن این مشکل، خانواده مدل های اتورگرسیو ناهمواریانس شرطی تلفیق یافته کسری (figarch) به صورت ترکیبی با مدل arfima معرفی می شوند. در ادامه، مدل های gar و arg، به عنوان مدل های با حافظه بلند مدت، با استفاده از روش های شبیه سازی، برای مقایسه با مدل arfima-figarch، مورد بحث و بررسی قرار می گیرند.
سمانه خرم شکوه مسعود یارمحمدی
چکیده تغییر پذیری یک معیار آماری برای نشان دادن میزان پراکندگی درآمد برای یک شاخص بازار است. در سری های زمانی مدل های ناهمواریانس شرطی از جمله مدل هایی می باشند که هدفشان توضیح این گونه از تغییرات است. در این پایان نامه نخست مدل ناهمواریانس شرطی خود برگشت کسری تلفیق یافته (figarch) برای کنترل حافظه بلند مدت در واریانس شرطی معرفی می شود. خاصیت حافظه بلند مدت به این مدل اجازه می دهد تا گزینه بهتری نسبت به دیگر مدل های ناهمواریانس شرطی برای مدل سازی تغییر پذیری در بعضی موارد مانند نرخ های ارز، بازده بازار سهام و نرخ های تورم باشد. در ادامه نحوه شناسایی و روشهای برآورد پارامترهای مدل های figarch با استفاده از روش های شبیه سازی مورد بحث و بررسی قرار می گیرد. واژه های کلیدی: مدل ناهمواریانس شرطی خود برگشت کسری تلفیق یافته (figarch)، حافظه بلند مدت، تغییر پذیری، برآورد، شناسایی
ابراهیم فربد (بایزیدی) نرگس عباسی
در این پایان نامه مبنای نظریه ی مجانبی برای میانگین متحرک دوره ای متغیرهای تصادفی مستقل و هم توزیع با دم هایی که دارای تغییرات منظم هستند، در حالی در نظر گرفته می شود که ضرایب میانگین متحرک براساس دوره تغییرات فصلی متفاوت هستند. یک فرمول بندی مجدد ساده براساس نتایج مرتبط با میانگین متحرک از بردارهای تصادفی به دست می آید. نتیجه ی اصلی این است که وقتی متغیرهای تصادفی مشخص شده، دارای واریانس متناهی هستند و گشتاور مرتبه ی چهارم آنها نامتناهی است، خودهمبستگی های نمونه ای بطور مجانبی پایدار می شوند. به عنوان یک نتیجه ی تحقیق، به نتیجه ی مشهور ی که خود همبستگی های نمونه در کلاسی از مدل میانگین متحرک که بطور مجانبی نرمال می باشند، خواهیم رسید.
ایلناز فلاحی مسعود یارمحمدی
داده های پانلی به داده های جنوبی گفته می شود که شامل اندازه گیری ها در طول زمان است.این داده ها حداقل برای یک مقطع و یک دوره ی زمانی خاص مشاهده می شود. حضور مشاهدات دورافتاده برآوردهای کلاسیک مربوط به داده های پانلی را متاثر ساخته و نتایج مورد انتظار را مخدوش می نماید. هدف از این تحقیق مطالعه ی تکنیک های رگرسیون استوار در چارچوب اثرات ثابت خطی داده های پانلی می باشد.استواری روش های مطالعه شده با محاسبه ی مقدار نقطه ی فروریزش و انجام روش های شبیه سازی شده بررسی شده است.
یوسف خسروانیان نرگس عباسی
آماره ی t2ی هتلینگ، وقتی ماتریس کواریانس نامعلوم باشد? به عنوان آماره ای برای آزمون فرض در مورد میانگین یک توزیع نرمال چند متغیره به کار می رود. در مورد چگونگی این که توزیع t2ی هتلینگ به مقیاس درآورده شده? توزیع f محسوب شود، در این پایان نامه اشاره شده است. تاکنون ویژگی های میانگین نمونه و کواریانس و آماره یt2ی هتلینگ تحت مدل بیضی گون، توسط برخی صاحب نظران مورد مطالعه و بررسی قرارگرفته بود. نشان داده شده که میانگین نمونه به صورت توزیع بیضی گون باقی می ماند و کواریانس نمونه? دارای نوعی توزیع ویشارت تعمیم یافته، می باشد. همچنین اندازه ی آزمونt2ی هتلینگ در برابر انحراف از وضعیت نرمال? استوار است و به طور یکنواخت قوی ترین آزمون پایا در خانواده ی توزیع بیضی گون به شمار می آید.
الهام کمانگر مسعود یارمحمدی
در نظر گرفتن یک فرض کلاسیک در ساختمان سری ها موجب شده است، مشاهدات را با یک الگوی خطی که ضرایبش با زمان تغییر نمی کند در نظر گیرند. اما بسیاری از سری های زمانی دارای میانگین و واریانس ثابتی در طول زمان نیستند در این شرایط مدل های اتورگرسیو مشروط به ناهمسانی واریانس اغلب به نتایج مطلوبی منجر می شوند. تحقیقات نشان داده اند مدل های شبکه عصبی برای نمایش رفتار غیرخطی داده ها نیز از عملکرد قابل توجهی برخورد است. در این تحقیق مدل های اتورگرسیو مشروط به ناهمسانی واریانس و شبکه عصبی مورد بررسی قرار می گیرد. مدل های arch و garch از خانواده مدل های اتورگرسیو مشروط به ناهمسانی واریانس و شبکه عصبی gmdh مبنی بر الگوریتم ژنتیک از خانواده مدل های شبکه عصبی معرفی شده و کاربرد آن ها بر روی داده های بورس از مهر ماه 89 تا مهر ماه 92 در مدل سازی شاخص بازده سهام بورس اوراق بهادار تهران بررسی و بر اساس سه معیار mse، rmse و mape از لحاظ قدرت پیش بینی مورد مقایسه قرار گرفته اند. کلمات کلیدی: سری های زمانی غیرخطی، مدل garch، مدل gmdh، الگوریتم ژنتیک
رویا ماجدی مسعود یارمحمدی
فرآیند درون یابی داده های گمشده در تحلیل سریهای زمانی بسیار مهم است . روش مرسوم استفاده از مدلهای اتو رگرسیو – میانگین متحرک باکس و جنکینس جهت درون یابی این داده ها است . در تحقیقات پیشرفته اخیر در مباحث سری زمانی روش دیگر بیان مدلهای سری زمانی در قالب مدلهای فضای حالت و استفاده از صافی کالمن است . در این پایان نامه نخست روشهای درون یابی مقادیر گمشده در سری زمانی را معرفی کرده و سپس با استفاده از روشهای شبیه سازی کارایی آنها در تحلیل سریهای زمانی با داده های گمشده مورد بحث و بررسی قرار می گیرد .
محسن محمدزاده پرویز نصیری
چکیده در این پایان نامه ضمن معرفی توزیع وایبل، برآوردگر درستنمایی ماکزیمم و بیز پارامتر مقیاس توزیع وایبل با داده های سانسور شده را با استفاده از توزیع پیشین جفری و توزیع پیشین جفری تعمیم یافته تحت توابع میانگین مربع خطا و میانگین درصد خطا محاسبه و با یکدیگر مقایسه شده اند. در پایان ضمن مقایسه کارایی برآوردگرها نتیجه می شود که پارامتر برآورد شده توزیع وایبل بدست آمده از روش بیز با توزیع پیشین جفری نسبت به پارامتر برآورد شده بدست آمده از روش بیز با توزیع پیشین جفری تعمیم یافته و روش درستنمایی ماکزیمم نتیجه بهتری دارد. هنگامی که حجم نمونه افزایش پیدا می کند میانگین مربع خطا (mse) و میانگین درصد خطا (mpe) دراکثر موارد کاهش می یابد. کلید واژه: توزیع پیشین جفری، توزیع وایبل ، برآورد، روش بیزی; keywords: jeffrey prior distribution; weibull distribution; estimation; bayes method;
هادی عبدالحسینی مسعود یارمحمدی
چکیده ندارد.
امید سیستانی پور مسعود یارمحمدی
چکیده ندارد.
فاطمه صادقی بهمن زندی
چکیده ندارد.
مجتبی موحدی صیقلان مسعود یارمحمدی
چکیده ندارد.
احسان افکار مسعود یارمحمدی
چکیده ندارد.
جمیله خلیلی حمزه ترابی
چکیده ندارد.
حامد هارونی سنقری مسعود یارمحمدی
چکیده ندارد.
مهناز محمدی مسعود یارمحمدی
چکیده ندارد.
ابوطالب لطف الله مسعود یارمحمدی
تحلیل طیفی یک روش توسعه یافته برای تحلیل سری های زمانی در قلمرو فرکانس است. این روش از متداولترین شیوه های مورد استفاده برای کاهش مناسب داده ها و متعاقباً مقایسه این گونه از ثبت داده هاست. اشتباهات ذاتی یا سهوی در داده های یک سری زمانی تحت بررسی می تواند نتایج گمراه کننده و غیر سودمندی در نتایج مربوط به طیف آن داده ها برجای گذارد. به این منظور ضمن بیان انواع داده های دورافتاده در سری های زمانی و تبیین نقش حساس آن ها در نتایج، به ارائه برآورد استوار تابع چگالی طیفی می پردازیم. یکی از این روش ها یافتن تابع چگالی طیفی استوار با استفاده از تبدیل فوریه تابع اتوکوواریانس استوار شده می باشد. روش دیگر پیش وزن دار کردن برای کاهش ریسک داده های دورافتاده در تابع چگالی طیفی می باشد. سپس با انجام روش های شبیه سازی کارایی این روش ها در رابطه با نقاط دور افتاده از نوع جمع پذیر و ابداعی مورد مقایسه قرار می گیرد.
فاطمه سادات حسینی بهارانچی مسعود یارمحمدی
در این پایان¬نامه، ضمن معرفی داده¬های دورافتاده و بیان اهمیت شناسایی آنها، دو روش استوار جهت شناسایی داده¬های دورافتاده چندمتغیره به نام¬های بیضی با حجم مینیمم (mve) و ماتریس کوواریانس با کمترین دترمینان (mcd) معرفی و مورد مقایسه قرار می¬گیرد. سپس با توجه به اینکه برآورد mcd نسبت به برآوردگر mve دارای نقطه فروریزش بالا، تابع نفوذ کراندار، خاصیت هم¬وردای افاین و کارایی مجانبی بالایی است، به رابطه معکوس نقطه فروریزش برآورد mcd و کارایی آن اشاره گردیده و استفاده از نقطه فروریزش 0/25 برای کارایی معقول برآورد mcd پیشنهاد می¬شود. در ادامه، کارایی عوامل سازگاری (تحت توزیع¬های) مختلف بیان شده و با استفاده از شبیه¬سازی مورد مقایسه قرار می¬گیرد. همچنین اشاره می¬شود که نه تنها به کارگیری عامل تصحیح اریبی و گام وزن¬دار کردن، نقطه فروریزش برآوردگر mcd اولیه را تغییر نمی¬دهد بلکه کارایی آن را نیز می¬افزاید.
ابراهیم نصیری فر مسعود یارمحمدی
هدف اصلی از این تحقیق تعمیم روشهای رگرسیونی نیرومند به مدلهای سریهای زمانی است . در ابتدا پس از ارائه روشهای رگرسیونی نیرومند شامل رگرسیون l1 ، -m برآورد ها ، -gm برآوردها، روش lms و روش lts جهت انتخاب بهترین روش ، به مقایسه کارایی آنها در رابطه با کاهش اثر نقاط پرت بر روی برآورد پارامترهای مدل پرداخته می شود. در ادامه پس از بیان انواع نقاط پرت و روشهای شناسایی آنها در مدلهای سریهای زمانی روشهای نیرومند جهت کاهش اثر این نقاط مورد مطالعه قرار گرفته شده است . این روشها شامل -m برآوردها، برآوردهای tra و برآوردهای rgm می باشد. در پایان با استفاده از یک مثال کاربردی و شبیه سازی نیرومندی روشهای برآورد ra و rgm در مقایسه با روش lsمورد بحث و بررسی قرار می گیرد.
مریم جوادی مسعود یارمحمدی
در این تحقیق انواع نقاط دورافتاده و تغییرات ساختاری در یک سری زمانی از مشاهدات ، تعریف شده و اثرات آنها در تعیین مدل و برآورد پارامترهای آن مورد بررسی قرار می گیرد. همچنین شیوه تکراری چن و لئو برای شناسایی انواع نقاط دورافتاده و شیوه تکراری کیزر برای شناسایی انواع تغییرات ساختاری در مدل سریهای زمانی فصلی با استفاده از مدل فضای وضعیت و پالایه کالمن مرور شده و سپس با استفاده از روشهای شبیه سازی ، ویژگیهای روشهای فوق الذکر مورد بررسی و تحلیل قرار می گیرد.