نام پژوهشگر: محسن محمدزاده
افشین فلاح محسن محمدزاده
وقتی اطلاعات مختلف مربوط به واحدهای جامعه در چند مجموعه داده یا فایل قرار دارند، بکارگیری تنها یکی از این فایل ها به معنی از دست دادن اطلاعات تکمیلی موجمود در سایر فایل ها است. بنابراین یکپارچه ساختن اطلاعات پراکنده ی افراد یک جامعه در مجموعه داده های مختلف، می تواند برای دسترسی به اطلاعات کامل و غیر تکراری واحدهای جامعه بسیار سودمند باشد. برای این منظور لازم است رکوردهای یکسان درون یک مجموعه داده یا بین مجموعه داده های متفاوت شناسایی و پیوند داده شوند. این کار که پیوند رکوردها نامیده می شود، معمولا به دو صورت قطعی و احتمالاتی صورت می پذیرد. در این رساله پیوند احتمالاتی رکوردها و تحلیل آماری بر مبنای داده های پیوند یافته، مورد مطالعه قرار گرفته است. در فصل 1 مفاهیم اولیه ی پیوند رکوردها معرفی شده اند. در فصل 2 مبانی نظری پیوند رکوردها، مدلهای احتمالاتی آن و قواعد پیوند مختلف از دیدگاههای بسامدی و بیزی مورد بحث و بررسی قرار گرفته اند. در فصل 3 پیوند احتمالاتی رکوردهای فارسی که به دلیل ویژگی های خاص زبان فارسی دارای مشکلات و پیچیدگی های زیادی می باشد، مورد بحث قرار گرفته و راهکارهایی برای حل برخی از دشواری های آن ارائه شده. نحوه ی بکارگیری آنها در قالب دو مثال کاربردی به نمایش گذاشته شده است. فصل 4 به تحلیل رگرسیونی با داده های پیوند یافته اختصاص دارد. نشان داده شده است که به دلیل وجود خطاهای انطباق، برآوردگرهای کمترین توانهای دوم ضرایب رگرسیونی در این حالت لزوما بهینه نیستند. سپس برای تحلیل رگرسیونی با داده های پیوند یافته، روشی مبتنی بر لحاظ نمودن توزیع متغیر پاسخ و با تاگید بر رهیافت بیزی پیشنهاد شده و کارایی روش پیشنهادی در یک مطالعه ی شبیه سازی با سایر روشهای موجود مقایسه شده است. همچنین روشی برای تحلیل رگرسیون لوژستیک با داده های پیوند یافته برای متغیر پاسخ و دوحالتی، با لحاظ نمودن آمیخته ای از توزیع های برنولی و استفاده از الگوریتم em ارائه و براساس آن یک برآوردگر ماکسیمم درستنمایی تکراری برای ضرایب رگرسیونی پیشنهاد شده است. کارایی برآوردگر پیشنهادی و تاثیر خطاهای انطباق بر آن نیز در یک مطالعه ی شبیه سازی مورد ارزیابی قرار گرفته است. نهایتا خلاصه یافته های پژوهشی این رساله به همراه نتایج و پیشنهادات ارائه شده است.
امید کریمی محسن محمدزاده
در اغلب تحلیل های آمار فضایی فرض بر این است که داده ها تحققی از یک میدان تصادفی گاوسی هستند، اما مشخصه های ناگاوسی مانند متغیرهای تصادفی نامنفی با توزیع چوله در اکثر زمینه های علمی دیده می شوند. مدل بندی این نوع داده ها با استفاده از میدان تصادفی چوله گاوسی، که براساس توزیع چوله نرمال چند متغیره تعریف شده و از انعطاف پذیری بیشتری برخوردار است، صورت می پذیرد. در این رساله خانواده توزیع های چوله نرمال بسته که نسبت به ترکیبات خطی و توزیع های شرطی بسته است، برای تحلیل داده های فضایی چوله مورد مطالعه قرار گرفته است. سپس پیشگویی فضایی بیزی برای میدان تصادفی چوله گاوسی بسته ارائه شده و مطالعات شبیه سازی برای بررسی مناسب بودن مدل با بکارگیری معیار میانگین توان دوم خطاها صورت پذیرفته است. بعلاوه مدل چوله گاوسی بسته روی داده های واتنش و حداقل دمای هوا با استفاده از معیار اعتبارسنجی متقابل مورد ارزیابی قرار گرفته و کاهش میانگین توان دوم خطاهای معیار اعتبارسنجی متقابل برای مدل چوله گاوسی بسته نشان داده شده است. سپس توزیع چوله نرمال بسته در دو مدل « رگرسیون فضایی با خطاهای خود همبسته همراه با مشاهدات گمشد? متغیر پاسخ» و «معکوس ارتعاشی» بکارگرفته شده و پارامترهای آنها با رهیافت بیزی و استفاده از الگوریتم های زنجیر مارکوف مونت کارلویی برآورد شده اند. آنگاه مدل رگرسیون پیشنهادی را برای تحلیل داده های آلودگی هوای تهران، که معمولاً چوله هستند، بکار برده و دقت پیشگویی با مدل های گاوسی و چوله گاوسی بسته توسط معیار اعتبارسنجی متقابل ارزیابی شده است. در ادامه مدل معکوس گاوسی بیزی را به «مدل معکوس چوله گاوسی بسته بیزی» تعمیم داده و نحوه مدل بندی چولگی متغیرهای مورد مطالعه برای تحلیل داده های ارتعاشی نشان داده شده است. سپس داده های خاصیت های موادالاستیکی با این دو مدل تحلیل شده و دقت پیشگویی مولفه های خاصیت های موادالاستیکی توسط هر دو مدل از طریق معیار میانگین توان دوم خطاهای پیشگویی مورد ارزیابی قرار گرفته است.
علی آقامحمدی محمدرضا مشکانی
اگر برای حل یک مسئله لازم باشد بیش از یک فرض یه طور همزمان آزمون شوند, آزمون هر فرض به طور جداگانه مشکلاتی تحت عنوان چندگانگی ایجاد میکند. در این گونه مسائل, از دیدگاه آمار بسامدی با تعریف نرخهای خطا به قسمی که شامل چندگانگی نیز باشند, روشهایی بر اساس کنترل بعضی از این نرخها ارایه شده است] که معمولا به روشهای ( با توجه به نگارش پایان نامه با نرم افزار فارسی تک فایل word آن موجود نمی باشد و فایلهای تک ارسال شده است ) مقایسه های چندگانه بسامدی معروف هستند. بر عکس, روشهای مقایسه های چندگانه ا دیدگاه آمار بیزی, به جای نرخهای خطا با تعریف توابع زیان و استفاده از رهیافت نظریه تصمیم شروع شد. با ابداع روشهای mcmc که باعث تسهیل محاسبات در تحلیلهای بیزی شد, مقایسه های چندگانه بیزی نیز کاربرد زیادی در استنباط آماری پیدا کردند. در این رساله, مقایسه های چندگانه پارامترهای جوامع نرمال از دیدگاه آمار بیزی ارایه شده است. روش ارایه شده برای مقایسه های چندگانه وایانسها بر اساس مدل گزینی بیزی است, که روشی معمول در مقایسه های چندگانه است. مزیت این روش در محاسبه توزیعهای پسینی هر تابع پارامتری دلخواه با استفاده از تکنیک میانگن گیری مدل بیزی است, در نتیجه مقایسه های دوبه دوی واریانسها نیز با روش ارایه شده امکان پذیر است. روشهای مقایسه های چندگانه متعددی برای میانگینها ارایه شده است. اما در بعضی آزمایشها محقق علاقه مند به مقایسه های چندگانه میانگینهای متوالی جوامع است. بویژه چنین مطالعاتی زمانی که آزمایشگر به دلایلی از قبل معتقد به وجود نوعی ترتیب خاص (افزایشی یا کاهشی) بین میانگیها است, اهمیت دارد. در این حالت نیز روشهای بسامدی برای آزمون فرض فراموضعی و مقایسه های دوبه دو ارایه شده اند. در قسمت دوم رساله, روشهایی برای مقایسه های چندگانه از دیدگاه آمار بیزی برای مقایسه های متوالی میانگینهای جوامع نرمال ارایه شده است. در حالتی که میانگینها به طور افزایشی یا کاهشی هستند, روشهای بسامدی معمولا این اطلاع پیشینی را نادبده می گیرند, ولی در روش بیزی ارایه شده توزیعهای پیشینی طوری تعریف می شوند که شامل این نوع اطلاع پیشینی نیز باشند. برای آزمون فرضهای چندگانه متوالی میانگینها در حالت کلی روش گام به گام بیزی ارایه می شود, که نسبت به روشهای تک گامی دارای توان بالاتری است. برای آزمون فرضهای یک طرفه با فرض افزایشی یا کاهشی بودن میانگینها, روش گام به پس بیزی ارایه شده است. برای مقایسه کارایی روشهای ارایه شده با روشهای معمول نیز با استفاده از تکنیکهای mcmc شبیه سازیهایی انجام شده که نتایج انها حکایت از کارایی بالای روشهای پیشنهادی نسبت به روشهای معمول است. در انتها مواردی برای بهبودی مدلها و موضوعاتی برای پژوهشهای آینده پیشنهاد شده است.
فاطمه حسینی محسن محمدزاده
مدل های آمیخته خطی تعمیم یافته فضایی برای مدل بندی پاسخ های فضایی گسسته به کار می روند، که در آنها ساختار همبستگی فضایی داده ها از طریق متغیرهای پنهان با توزیع نرمال در نظر گرفته می شود. هر چند فرض نرمال بودن توزیع متغیرهای پنهان موجب سهولت محاسبات می شود، اما در عمل به دلیل غیرقابل مشاهده بودن متغیرهای پنهان، بررسی نرمال بودن این متغیرها مقدور نیست و پذیرش ناصحیح این فرض می تواند روی دقت برآورد پارامترها و پیشگوها تاثیر سوء داشته باشد. لذا در این رساله از دو خانواده توزیع های چوله نرمال و چوله نرمال بسته که شامل خانواده نرمال نیز هستند، برای توزیع متغیرهای پنهان پیشنهاد شده و پیشگویی متغیرهای پنهان و برآورد ماکسیمم درستنمایی پارامترهای مدل مورد مطالعه قرار گرفته است. سپس پیشگویی فضایی بیزی متغیرهای پنهان چوله ارائه و در دو مطالعه شبیه سازی مورد ارزیابی قرار گرفته است. نحوه کاربست مدل آمیخته خطی تعمیم یافته با متغیرهای پنهان چوله روی داده های دمای هوا به نمایش گذاشته و براساس معیار اعتبار سنجی متقابل برتری مدل پیشنهادی بر مدل نرمال نشان داده شده است. طولانی بودن زمان محاسبه برآوردها و پیشگویی های بیزی انگیزه ای برای معرفی روش بیز تقریبی گردید که از سرعت بالاتری برخوردار است. این روش در یک مطالعه شبیه سازی و دو مجموعه داده واقعی به کار گرفته شده و دقت پیشگویی مدل با دو فرض نرمال و چوله نرمال بودن متغیرهای پنهان بررسی و عملکرد دو روش بیز تقریبی و معمولی مورد ارزیابی قرار گرفته است.
حسین باغیشنی محسن محمدزاده
دگرگونی های عمده در حجم و پیچیدگی تحلیل داده ها در کنار پیشرفت های اساسی روش های محاسباتی، استفاده از مدل های آماری دقیقتر اما پیچیده تر را به همراه داشته اند. روشی معمول برای مدل بندی داده های ناگاوسی همبسته، استفاده از مدل های آمیخته خطی تعمیم یافته و برای داده های فضایی ناگاوسی، مدل های آمیخته خطی تعمیم یافته فضایی می باشد، که در آن همبستگی فضایی داده ها از طریق اثرات تصادفی در مدل لحاظ می شود. تحلیل مبتنی بر درستنمایی این گونه مدل ها به دلیل وجود انتگرال های با بعد بالا مشکل و پیچیده است. از طرفی تحلیل بیزی مبتنی بر روش های mcmc در کنار دو مشکل انتخاب توزیع های پیشین مناسب و وابستگی دقت نتایج به این انتخاب، از مشکلات متعددی مانند تشخیص همگرایی زنجیر و زمان طولانی محاسبات رنج می برد. همسانه سازی داده ها (dc) روشی برای برآورد پارامترهای یک مدل سلسله مراتبی است. این روش در حالی که از چارچوب بیزی و الگوریتم های mcmc بهره می برد، ترفندی محاسباتی برای محاسبه mle و برآورد واریانس آن ها است، که نیازی به حل انتگرال های با بعد بالا، ماکسییم سازی و مشتق گیری از یک تابع پیچیده ندارد و نتایج مبتنی بر آن نسبت به انتخاب توزیع های پیشین پایا هستند. در این رساله به استننباط مبتنی بر درستنمایی در مدل های آمیخته خطی تعمیم یافته برای تحلیل داده های فضایی ناگاوسی با روش های dc و درستنمایی مرکب پرداخته شده است و کارایی آن ها نیز مورد مقایسه قرار گرفته اند. از آنجا که روش dc مشکلات الگوریتم های mcmc را به ارث می برد، از ترکیب دو روش dc و تقریب لاپلاس آشیانه ای جمع بسته، روش جدید hdc پیشنهاد شده است و در مطالعات شبیه سازی کارایی آن مورد بررسی قرار گرفته و برتری آن نسبت به روش های موجود نشان داده شده است.
الهام بهشاد محسن محمدزاده
برای تحلیل داده های فضایی-زمانی که بر حسب موقعیت فضایی و زمانی به یکدیگر وابسته هستند، لازم است ساختارهمبستگی آن ها توسط کواریانس فضایی-زمانی تعیین گردد. این تابع کواریانس که نقش به سزایی در پیشگویی موقعیت های فضایی یا زمانی فاقد مشاهده دارد، معمولا نامعلوم است و بایستی بر اساس مشاهدات برآورد شود. پذیرش فرض هایی مانند مانایی، تقارن و تفکیک پذیری تابع کواریانس فضایی-زمانی به نحو قابل ملاحظه ای برازش یک مدل معتبر به داده ها را تسهیل می نماید. اما ضرورتا این فرض ها در مسائل کاربردی محقق نمی باشند. لذا لازم است صحت هر یک از آن ها مورد بررسی قرار گیرند. در سال های اخیرمطالعات زیادی در زمینه بررسی تحقق این فرض ها با روش های پارامتری و ناپارامتری صورت پذیرفته است. در این پایان نامه ابتدا با فرض گاوسی بودن میدان تصادفی آزمون تفکیک پذیری نسبت درستنمایی میشل بیان می شود. سپس بدون هیچ-گونه فرضی بر روی توزیع داده ها، انواع آزمون های ناپارامتری و طیفی ارائه شده برای تقارن و تفکیک پذیری تابع کواریانس فضایی-زمانی معرفی خواهند شد. آن گاه اندازه و توان هر یک از آزمون های مطرح شده درمطالعه شبیه سازی تحت شرایط مختلف ارزیابی شده و تحت شرایطی یکسان آزمون های مختلف تقارن وتفکیک پذیری مورد مقایسه عددی قرار می گیرند و برای وضعیت های مختلف آزمون مناسب تر معرفی می شود. نهایتا روش های آزمون برتر برای بررسی هر یک از ویژگی های ساختارهمبستگی داده های سرعت باد اقیانوس آرام به کار گرفته شده و تابع کواریانس فضایی-زمانی مناسب به داده ها برازش داده می شود.
حمیدرضا رسولی محسن محمدزاده
داده های فضایی که در زمان های متوالی به دست آیند، داده های فضایی-زمانی و اگر این داده ها در طول زمان مستقل باشند، داده های پانلی فضایی نامیده می شوند. برای مدل بندی این داده ها لازم است همبستگی فضایی یا فضایی-زمانی آن ها، به نحوی لحاظ شود. با فرض اینکه بین متغیرهای وابسته یا خطاهای مدل رابطه اتورگرسیو برقرار باشد، می توان همبستگی فضایی یا فضایی-زمانی را در مدل بندی مشاهدات لحاظ کرد. یک مسئله مورد توجه در مدل بندی داده های پانلی یا فضایی-زمانی تغییر-پذیری بین واحد های آزمایشی است. به علت عدم تجانس موقعیت های فضایی ممکن است هر موقعیت اثر مختلفی بر داده ها داشته باشد و این اثرات به صورت ثابت یا تصادفی در نظر گرفته می شوند. مدل های اتورگرسیو فضایی برای لحاظ کردن وابستگی فضایی داده ها در مدل بندی مشاهدات به کار می آیند و با تعمیم این مدل ها، داده های فضایی-زمانی را نیز می توان مدل بندی کرد. با استفاده از مدل های اتورگرسیو فضایی-زمانی فرض همبستگی فضایی و زمانی را به طور همزمان در مدل بندی داده ها می توان لحاظ کرد. در این پایان نامه نخست سه رده مدل های اتورگرسیو فضایی، پانلی فضایی و اتورگرسیو فضایی-زمانی و ویژگی های آن ها بررسی شده و با دو رهیافت بسامدی و بیزی برآورد پارامترهای آن ها ارائه شده اند. در انتها نحوه کاربست مدل های ارائه شده برای تحلیل داده های ازن شهر تهران نشان داده شده و عملکرد آن ها مورد بررسی قرار گرفته است.
وریا عبدالله نژاد عادل محمدپور
چکیده امروزه جمع آوری اطلاعات از طریق کامپیوتر و اینترنت باعث تولید زیاد داده شده است. کسب دانش از مجموعه داده های بزرگ ممکن است پیچیده و در مواردی غیر ممکن به نظر آید، بنابراین نیاز به داشتن روش ها و تکنیک هایی برای تلخیص و استخراج اطلاعات از این نوع داده ها ضروری است. یکی از تکنیک های مرسوم برای این کار خوشه بندی است. اساس این روش خلاصه کردن یک مجموعه از مشاهدات در تعداد محدودی گروه است، یا به طور هم ارز ایجاد یک افراز روی مجموعه ای از مشاهدات در داخل چند گروه جدا از هم به طوری که مشاهدات داخل هر گروه مشابه یکدیگر می باشند و مشاهداتی که در گروه های متفاوت قرار گرفته اند شباهت کمتری دارند. نوع خاصی از داده هایی که در چند سال اخیر بیشتر به آن توجه شده است داده های طولی می باشند که در واحدهای متوالی زمان از واحدهای مشخص به دست می آیند. هدف این پایان-نامه ارائه روشی برای خوشه بندی مدل-پایه برای داده های طولی است. برای این منظور داده های طولی با استفاده از توزیع های گاوسی و ناگاوسی با در نظر گرفتن ساختار کوواریانس مناسب برای این داده ها، خوشه-بندی می شوند.
فاطمه باذل زیوه حمیدرضا نواب پور
چکیده به علت اندک بودن داده های آمارگیری در کوچک ناحیه ها، براوردگرهای مستقیم از دقت بالایی برخوردار نیستند. با توجه به افزایش وسیع تقاضا برای تولید آماره های معتبر و دقیق برای کوچک ناحیه ها، سعی شده است که با ارایه رویکردهای مناسب این مشکل حل شود. رویکردهای براورد کوچک ناحیه ای براساس مدل به خصوص آن هایی که براساس مدل های آمیخته ی خطی با اثرهای تصادفی ناحیه ای هستند با استفاده از منبع های مختلف اطلاعات کمکی به برارودگرهای مستقیم قدرت وام می دهند تا دقت آن ها را افزایش دهند. این رویکردها نسبت به مشخص-سازی مناسب مدل حساسیت بالایی دارند. در بعضی از مسایل کاربردی برازش مدل کار بسیار مشکلی است. در این حالت، رویکرد مستقیم مدل پایه (mbd) جایگزین مناسبی برای نااستواری براوردگرهای نامستقیم مدل پایه است. این رویکردها ترکیب خطی موزون از داده های نمونه ای با وزن های چند منظوری است. این وزن ها از مدلی که به صراحت اثرهای تصادفی ناحیه ها در آن در نظرگرفته شده است قدرت وام می گیرد. در این پایان نامه ضمن آشنایی با روش های برارود کوچک ناحیه ای، رویکرد وزنی مستقیم مدل پایه در براورد کوچک ناحیه ای مورد بررسی قرار گرفته است. در بخش کاربردی با استفاده از اطلاعات سرشماری کشاورزی سال 1382 استان فار برارود کوچک ناحیه ای برای شهرستان های این استان با رویکرد مذکور و روزیکر بهترین پیشگوی نااریب خطی براساس مدل در سطح واحد آماری به دست آورده و هر کدام از این رویکردها براساس براورد میانگین توان دوم خطای با هم مقایسه شده اند. واژه های کلیدی: کوچک ناحیه ای، مدل آمیخته ی خطی، وزن های نمونه ای چندمنظوری، برارودگر mbd، براوردگر eblup
وحید رضایی تبار حمید پزشک
معمولا برای پیشگویی ساختار دوم پروتئین از الگوهای مارکف پنهان پروفایل استفاده می شود. از آنجا که ساختار دوم پروتئین در خانواده های پروتئینی حفظ می شود، نسبت دادن یک توالی منجر به تعیین ساختار دوم آن می شود. در الگوهای مارکف پنهان پروفایل، به منظور نسبت دادن دنباله های پروتئینی، تنها اطلاعات موجود در سمت چ اسیدهای آمینه مورد مطالعه قرار می گیرد. به عبارت دیگر، یک وضعیت پنهان به تنها به وضعیت ماقبل خود وابسته است و مشاهدات به شرط آنکه وضعیتهای مربوطه داده شده باشند از یکدیگر مسستقلند. اما به نظر می رسد که در نظر گرفتن اطلاعات موجود در روند تکاملی و اطلاعات همسایگی، دقت پیشگویی را افزایش دهد. به منظور در نظر گرفتن اطلاعات موجود در روند تکاملی از آمار فضایی استفاده می شود که وابستگی مکانی بین مشاهدات را مورد توجه قرار می دهد. در این رساله ابتدا برآورد پارامترهای الگو و محتملترین مسیر دنباله به ترتیب از طریق الگوریتمهای بام- ولش و ویتربی صورت می پذیرد. سپس اطلاعات موجود در روند تکاملی به اطلاعات موجود در سمت چپ دنباله ها اضافه گردیده و الگوریتمهای بام-ولش و ویتربی تعمیم داده می شود. همچنین الگوی مارکوف پنهان دو طرفه مورد توجه قرار گرفته و نتایج آن با نتایج حاصل از الگوی مارکوف پنهان فضایی مورد مقایسه قرار می گیرد. نتایج روی 20 پروفایل واقعی نشان می دهد که در نظر گرفتن اطلاعات موجود در روند تکاملی و همسایگی دقت پیشگویی انتساب دنباله های پروتئینی را افزایش می دهد.
زهرا قیومی محسن محمدزاده
مدل های گاوسی پنهان فضایی زیرکلاس گسترده و انعطاف پذیری از مدل های رگرسیون جمعی ساختاری هستند که در زمینه های کابردی متعددی مورد استفاده قرار می گیرند. گاهی در تحلیل بیز سلسله مراتبی این گونه مدل ها توزیع های پسینی یا شرطی کامل فرم بسته ای ندارند، لذا برای محاسب? آن ها معمولا از الگوریتم های مونت کارلوی زنجیر ماکوفی استفاده می شود. وجود همبستگی بین عناصر میدان پنهان معمولا موجب افزایش زمان محاسبات و ناهمگرایی الگوریتم می شود. برای حل این مشکل روش تقریب لاپلاس آشیانی جمع بسته استفاده می شود، که در آن روش های انتگرال گیری عددی و تقریب لاپلاس به طریقی کارا ترکیب می شود به طوری که محاسباتی سریع و تقریبی دقیق جایگزین شبیه سازی های سنگین می شود. در این پایان نامه ضمن مطالعه مدل های گاوسی پنهان فضایی و بررسی ویژگی های آن ها، میدان تصادفی مارکوفی گاوسی معرفی می شود. به علاوه خصوصیات این میدان تحت قیود خطی مورد مطالعه قرار می گیرد. سپس نحوه کاربست مدل های گاوسی پنهان فضایی و روش تقریب لاپلاس آشیانی جمع بسته روی داده های قیمت مسکن در شهر تهران به نمایش گذاشته و مدل برتر از بین پنج مدل معرفی شده که هر یک شامل انواع اثرات ثابت و تصادفی هستند، بر اساس ملاک های مناسب انتخاب و تحلیل می شود. به منظور نشان دادن کارایی روش تقریب لاپلاس آشیانی جمع بسته، مدلی با استفاده از این روش و الگوریتم های mcmc اجرا و زمان محاسبات و دقت مدل مورد مقایسه و ارزیابی قرار می گیرد.
کبری قلی زاده گزور محسن محمدزاده
مدل های رگرسیون جمعی ساختاری قالبی انعطاف پذیر از مدل های آماری در زمینه های کاربردی هستند. گاهی در تحلیل بیز سلسله مراتبی این مدل ها توزیع های پسینی فرم بسته ای ندارند و استفاده از الگوریتم های مونت کارلوی زنجیره مارکوفی (mcmc) ممکن است به دلیل پیچیده بودن و تعداد زیاد پارامترهای این مدل زمان بر باشد. برای حل این مشکل می توان از تقریب لاپلاس آشیانی جمع بسته استفاده کرد، که در آن با استفاده از تقریب های گاوسی و لاپلاس نیاز به شبیه سازی های سنگین mcmc نیست. در این پایان نامه ضمن مطالعه مدل های رگرسیونی جمعی ساختاری، میدان تصادفی گاوسی مارکوفی که در این مدل ها مورد استفاده قرار می گیرد مطالعه می شود. سپس مدل های رگرسیون جمعی ساختاری و نحوه برآورد آن با استفاده از روش تقریب لاپلاس آشیانی جمع بسته برای داده-های جرم شهر تهران بیان می شود و مدل برتر بر اساس ملاک های dic و نمره لگاریتمی اعتبار سنجی متقابل انتخاب و تحلیل می شود. سپس با مطاله ای شبیه سازی ، دقت و زمان انجام محاسبه مدل ها با استفاده از دو روش تقریب لاپلاس آشیانی جمع بسته و mcmc مورد مقایسه قرار می-گیرند. در انتها نتایج به دست آمده مورد بحث و نتیجه گیری قرار می گیرد.
حدیث بیداربخت محسن محمدزاده
یکی از موضوع های مهم در تحلیل داده های فضایی، نظیر پیشگویی فضایی، انتخاب موقعیت های نمونه گیری در ناحیه ی تحت بررسی یا فضای موقعیت ها است، به نحوی که نتایج حاصل ار انواع تحلیل های آماری داده های مشاهده شده در این موقعیت ها از دقت و اعتبار لازم برخوردار باشند. انتخاب این گونه موقعیت ها مستلزم تعیین ملاک هایی برای اندازه گیری دقت و صحت تحلیل های فضایی است. طرحی که از بهینه سازی یک ملاک ارزیابی حاصل شود طرح نمونه گیری فضایی بهینه نامیده می شود. از آنجا که وقوع هر پیشامد غیربدیهی حاصل از انجام یک آزمایش تصادفی همواره با عدم قطعیت همراه است و میزان این عدم قطعیت می تواند در ارزیابی وقوع آن پیشامد موثر واقع شود، می توان ملاک بهینگی طرح را تابعی از میزان عدم قطعیت نتایج تحلیل فضایی یا پیشگویی ها در نظر گرفت. در این پایان نامه تابع آنتروپی شانون برای اندازه گیری میزان عدم قطعیت پیشگویی های فضایی حاصل از یک طرح نمونه گیری به عنوان ملاک تعیین طرح بهینه در نظر گرفته شده است. از آنجا که معمولا در طرح آزمایشات محدب از مدل های رگرسیون خطی با خطاهای ناهمبسته برای تقریب متغیر پاسخ به عنوان یک راه حل مناسب برای تعیین طرح نمونه گیری بهینه استفاده می شود. در این پایان نامه با استفاده از این ایده و تقریب میدان تصادفی یا یک مدل رگرسیون خطی دارای ضرایب تصادفی اقدام به تعیین طرح نمونه گیری فضایی بهینه شده است. مدیریت منابع آب در استان خوزستان توسط وزارت نیرو بر اساس شبکه ای از ایستگاه های باران سنجی انجام می شود. این شبکه به مرور زمان بر حسب نیاز در منطقه ایجاد شده و لزوما در بهترین موقعیت ها به لحاظ فراهم اوردن نتایج تحلیلی بهینه قرار ندارند. به منظور ارتقای سطح اطلاعاتی که ایستگاه های باران سنجی در اختیار مدیریت منطقه قرار می دهند اقدام به بررسی وضعیت موجود و است.
نسرین مهدیان فرد محسن محمدزاده
برقراری پیوند میان سامانه اطلاعات مکانی و روشهای تصمیم گیری مرهون ابداع و تکامل روش تلفیق داده های مکانی است. روش های تلفیق اطلاعات، داده ها را برای دستیابی به نتیجه بهتر با یکدیگر ترکیب می کنند و هدف از آنها آشکارسازی اطلاعات موجود در مجموعه داده ها، برای افزایش قابلیت تفسیر اطلاعات و افزایش دقت تحلیل داده ها است. برای بهره برداری کامل از داده هایی که از منابع مختلف حاصل می شوند، در ادبیات موضوع روش های مختلف عددی و تحلیلی ادغام داده ها توسعه یافته اند. در این پایان نامه روش های تلفیق بیزی، تلفیق بیزی فضایی، کریگیدن و مقیاس کاهنده مورد مطالعه و بررسی قرار گرفته اند. در مدل تلفیق بیزی فضایی همبستگی های فضایی یا فضایی-زمانی، از طریق تابع کوواریانس فضایی یا یک مدل رگرسیونی فضایی زمانی منظور شده اند. به علاوه اعتبار اطلاعات حاصل از تلفیق بیزی اندازه ها و خروجی مدل های قطعی و روش کریگیدن مورد ارزیابی قرار گرفته است. سپس با تلفیق بیزی فضایی و کریگیدن اقدام به پیشگویی فضایی داده های اُزن شهر تهران شده و با ملاک میانگین توان های دوم خطا نتایج حاصل از آنها مورد ارزیابی و مقایسه قرار گرفته اند.
زهرا گنجی نوروزی علیرضا شکوهی
موفقیت مدیریت سیلاب و تصمیم گیری در مورد میزان حفاظت منطقه، نیازمند آنالیز ریسک سیل می باشد. از آنجا که بخش مهمی از خسارات ناشی از سیل، خسارت کشاورزی می باشد بدون برآورد آن عملاً نمی توان درجه محافظت و ریسک مطلوب در پروژه های مهندسی سیلاب را تعیین کرد. بر این اساس تحقیق حاضر بر روی سه بخش اصلی هیدرولیک سیل، برآورد خسارت کشاورزی و آنالیز ریسک متمرکز شده است. با توجه به ضرورت وجود توابع خسارت کشاورزی برای همه گیاهان منطقه جهت آنالیز ریسک خسارت کشاورزی سیل، در این مطالعه با ارائه یک روش تحلیلی علاوه بر بررسی رفتار متقابل گیاه و جریان، منحنی خمش گیاهان، ماکزیمم تنش کششی و نقطه شکست آنها در شرایط غیر مستغرق با به دست آوردن شرایط بحرانی جریان برای شکست گیاه، رابطه ای بین خسارت صددرصد و پارامترهای سیل تعریف گردید که می توان در مواقع فقدان تابع خسارت از آن به عنوان یک تخمین اولیه استفاده نمود. مقایسه روش تحلیلی ارائه شده با نتایج آزمایشگاهی برای محاسبه حاصل ضرب عمق در سرعت جریان به عنوان اندکس معرف در شکست گیاه و تنش کششی ماکزیمم، به ترتیب اختلافی کمتر از 5/0 و 1/0 درصد را نشان می دهد. همچنین با انجام یک مجموعه از آزمایشات برای گیاه نمونه برنج که کشت غالب مناطق شمال ایران و محصولی استراتژیک می باشد، تابع خسارت از طریق ایجاد ارتباط بین درصد خسارت و عواملی نظیر ارتفاع سیل، سرعت جریان، عدد رینولدز و غیره استخراج گردید. نتایج نشان داد که شبیه سازی تابع خسارت-عوامل فیزیکی سیل با پارامتر بی بعد رینولدز و تابع لگاریتمی بهترین نتیجه را به دست می دهد و میزان خسارت وارد شده به ترتیب در مراحل پس از نشا، ساقه زنی، درو و خوشه دهی کاهش می یابد. بنابراین زمان وقوع سیلاب از عوامل مهم در بروز خسارت کشاورزی به شمار می رود. بر این اساس تحلیل ریسک زمانی و مکانی خسارت کشاورزی برای منطقه آزارود با ترکیب نتایج شبیه سازی هیدرولیکی سیل توسط مدل cche-2d و توابع خسارت کشاورزی انجام گرفت. با توجه به عدم قطعیت پارامترهای متعددی که در برآورد خسارت کشاورزی مورد استفاده قرار می گیرند، علاوه بر تحلیل ریسک با استفاده از امید ریاضی پارامترها، تحلیل مزبور با در نظر گرفتن عدم قطعیت مهمترین عوامل موثر در ایجاد خسارت نیز انجام شد و نهایتاً به منظور سوق دادن تلاشهای میدانی به سوی جمع آوری اطلاعات دقیق تر روی مهمترین عوامل، سهم هر یک از عوامل در عدم قطعیت خسارت برآورد شده تعیین گردید. به عنوان نمونه خسارت سالانه مورد انتظار کشاورزی(agead) برای گستره سیل 500 ساله برابر با 8/1 درصد می باشد. این عدد با در نظر گرفتن عدم قطعیت تابع احتمال-دبی به 9/1 درصد، با در نظر گرفتن عدم قطعیت تابع احتمال-دبی و توابع خسارت به15/2 درصد و با در نظر گرفتن عدم قطعیت تابع احتمال-دبی، توابع خسارت و ضریب مانینگ (عدم قطعیت کلی) به 51/2 درصد افزایش می یابد. بر این اساس عدم قطعیت ناشی از هر کدام از موارد بالا به ترتیب برابر با 5/5، 44/19 و 44/39 درصد می باشد. کلمات کلیدی: تابع خسارت کشاورزی، خسارت سالانه مورد انتظار، تحلیل ریسک زمانی و مکانی، برنج، رفتار متقابل گیاه و جریان
مهدی بیگی اسفتانج محمدرضا فریدروحانی
داده هایی که ذاتاٌ تابعی پیوسته از یک متغیر دیگر مانند زمان، باشند داده های تابعی نامیده می شوند. خانواده های توزیع احتمال پارامتری ابزار حیاتی برای مدل بندی احتمالاتی و تحلیل داده ها محسوب می شوند. با این وجود در تحلیل داده های تابعی این خانواده از توزیع ها کمتر مورد مطالعه قرار گرفته است. در این پایان نامه یک خانواده توزیع احتمال پارامتری برای داده های تابعی مورد بررسی قرار گرفته است. توزیع احتمال مورد نظر با استفاده هممزمان از میانگین شبه حسابی و تابع مفصل ارشمیذدسی به دست می آید. علاوه براین، با استفاده از مشتق گاتو، تابع چگالی متناظر با آن نیز تعیین می شود. سپس این توزیع احتمال برای خوشه بندی داده های تابعی شبیه سازی شده براساس روش تجزیه آمیخته و داده های واقعی به کار گرفته می شود. در انتها بحث و نتیجه گیری ارائه می شود.
حمیدرضا کرمی محسن محمدزاده
اگر مشاهدات از لحاظ موقعیت قرار گرفتن در فضای مورد مطالعه به یکدیگر وابسته باشند، داده های فضایی هستند. همچنین داده های فضایی که در زمان های متوالی به دست آیند، داده های فضایی-زمانی و اگر این داده ها در طول زمان مستقل باشند، داده های پانلی فضایی نامیده می شوند. به دلیل وجود همبستگی فضایی یا فضایی-زمانی بین آن ها، لازم است به نحوی ساختار همبستگی آنها تعیین و در مدل بندی محسوب شود. این کار مستلزم تعیین ساختار همبستگی فضایی یا فضایی-زمانی داده ها از طریق تابع کوواریانس فضایی یا فضایی-زمانی است که معمولا نامعلوم است و باید بر اساس مشاهدات برآورد شود. یک مسئله مورد توجه در مدل بندی داده های پانلی یا فضایی-زمانی تغییر پذیری بین واحد های آزمایشی است. به علت عدم تجانس موقعیت های فضایی ممکن است هر موقعیت اثر مختلفی بر داده ها داشته باشد و این اثرات به صورت ثابت و تصادفی در نظر گرفته می شوند. با استفاده از مدل های پانلی فضایی-زمانی فرض همبستگی فضایی و زمانی را به طور همزمان در مدل بندی داده ها می توان لحاظ کرد. در این پایان نامه ابتدا مدل های پانلی، پانلی پویا و پانلی فضایی پویا و ویژگی های آن ها بررسی شده و با دو رهیافت بسامدی و بیزی پارامترهای آن ها برآورد می شود. همچنین نحوه لحاظ کردن اثرات فضایی در این مدل ها و برآورد این اثرات مطرح می شود. در یک مطالعه شبیه سازی کارایی روش های معرفی شده بررسی و مورد ارزیابی قرار می گیرد. سپس با استفاده از مدل های ارائه شده اثر شاخص های اقتصادی بر داده های جرم نشان داده می شود و عملکرد آن ها مورد بررسی قرار می گیرد.
امین مرادخانی محمودرضا حقی فام
شبکه توزیع متشکل از عناصر بسیار زیادی است که به علت ساختار شعاعی، خرابی آنها سهم زیادی در کاهش قابلیت اطمینان تغذیه مشترکین دارد. از سوی دیگر به خاطر تجدید ساختار و خصوصی سازی در صنعت برق و همچنین فرسودگی زیر ساختارها، فشار مضاعفی بر شرکت ها برای بهبود قابلیت اطمینان و کاهش هزینه ها وارد شده است. از این رو شرکت های توزیع به دنبال به کار بستن تکنیک های مدیریت دارایی برای طولانی کردن عمر مفید عناصر شبکه با در نظر گرفتن هزینه و کارایی و ریسک هستند. یکی از چالش های مهم در این راه، نبود نرخ خرابی دقیق برای عناصر شبکه توزیع است. در این رساله چالش های موجود در مسیر برآورد نرخ خرابی ثابت مورد مطالعه قرار گرفته و برای حل مشکل کمبود داده و تنوع جمعیتی عناصر، مدل های مبتنی بر رهیافت بیزی پیشنهاد شده است. همچنین مدلی برای برآورد نرخ خرابی متغیر مبتنی بر فرایند نقطه ای تصادفی ارائه شده است که بتواند اثر تعمیر و نگهداری و سایر عامل های تأثیر گذار را نشان دهد. برای برآورد پارامترهای مدل، روش مبتنی بر ماکزیمم درستنمایی معرفی شده است. علاوه بر آن با هدف یافتن عامل های تاثیر گذار بر نرخ خرابی، الگوریتم دو مرحله ای انتخاب ویژگی پیشنهاد شده است. سپس شیوه به کارگیری این مدل در برنامه ریزی تعمیر و نگهداری مورد مطالعه قرار گرفته است و با استفاده از آن برنامه ریزی تعمیر و نگهداری برای فیدرهای هوایی یک شبکه واقعی انجام شده است. در ادامه، الگوریتمی برای شبیه سازی زمان های خرابی پیشنهاد شده است که قابلیت به کارگیری مدل را در روش مونت کارلوی زمانی و همچنین برنامه ریزی مبتنی بر ریسک نشان می دهد. در نهایت برای یک شبکه واقعی، برنامه ریزی مبتنی بر ریسک تعمیر و نگهداری خطوط هوایی در حضور طرح تنظیم جریمه انجام شده و نتایج آن ارائه شده است.
محسن محمدزاده فرشته شهیدی
هدف کلی این پژوهش تعیین تاثیر انقباضهای برونگرای عضلات خم کننده آرنج و بازکننده های زانو برck ،ldh و crp سرم مردان فعال و غیرفعال بود. به این منظور بیست نفر آزمودنی داوطلب، بر اساس فعال و غیرفعال بودن انتخاب و به دو گروه تقسیم شدند. آزمودنی ها، به انجام سه مرحله15تایی انقباضهای بیشینه برونگرا در عضلات خم کننده آرنج و بازکننده زانو پرداختند. ck، ldh و crp سرم آزمودنی ها قبل، بلافاصله بعد، 24 و 48 ساعت پس از انجام فعالیت اندازه گیری شد. برای تجزیه و تحلیل داده ها از آزمون تحلیل واریانس در اندازه گیری های تکراری با عامل بین گروهی استفاده شد. نتایج این تحقیق نشان داد بین میزان کوفتگی تاخیری عضلات خم کننده آرنج و بازکننده زانو در هیچ کدام از دو گروه تفاوت معناداری وجود ندارد. همچنین در مقایسه گروه فعال و غیرفعال، میزان تغییرات ldh و ck به طور معنی داری در گروه غیرفعال از فعال بیشتر بود(05/0 ?p ). میزان تغییراتcrp دو گروه تفاوت معناداری نداشت ولی در همه مراحل تحقیق بین دست وپای دو گروه(001/0 ?p ) تفاوت معنا دار مشاهده شد. به نظر می رسد طول عضله هنگام انجام انقباض و زاویه مفصل نقش زیادی در میزان کوفتگی تاخیری عضلانی دارد.
سعید مومنی حمیدرضا نواب پور
دو رویکرد عمده همواره مورد نظر سازمان های آماری ملی بوده و هنوز هم است. اولین رویکرد آن ها انتشار آمار و اطلاعات برای برنامه ریزی، سیاست گذاری و ... در جامعه و رویکرد دوم آن ها حفظ محرمانگی اطلاعات واحدهای آماری فردی و موسسه ای است. اجرای همزمان این دو رویکرد توسط سازمان های آماری ملی، چالشی را برای آن ها به وجود می آورد. زیر را که رویکرد اول معادل است با گرداوری داده های غنی و کامل (تا حد امکان) که منبع ها اجازه می دهند. به دنبال آن کیفیت و جزئیات داده ها ارتقا یافته و ممکن است انتشار آن ها منجر به افزایش مخاطره ی افشای هویت و صفت واحدهای آماری شود. بنا بر این محرمانگی اطلاعات گرداوری شده ی این واحدها حفظ نشده و باعث می شود که پاسخ گویان اطلاعات دقیق و کامل را در اختیار سازمان های آماری ملی قرار ندهند و یا با آن ها همکاری نکنند. از این رو کیفیت داده های موجود با افزایش بی پاسخی و یا ارائه ی پاسخ های نادقیق کاهش می یابد و در نتیجه، آسیب های جبران ناپذیری به نحوه ی اداره ی جامعه وارد خواهد شد. یکی از این آسیب های مهم مخدوش شدن برنامه ریزی ها در جامعه است. برای پاسخ به چالش پیش روی تولید آمار توسط سازمان های آماری ملی؛ باید گفت که این سازمان ها می توانند بین انتشار آمارها و حفظ محرمانگی اطلاعات واحدهای آماری، موازنه ای داشته باشند. ابزار آماری لازم برای این موازنه از روش های کنترل و محدودسازی افشای آماری استفاده می کند. این روش ها به دو رسته ی پریشیدگی و ناپریشیدگی قابل تقسیم هستند که برای محدودسازی افشای داده های خرد و جدولی مورد استفاده قرار می گیرند. ابتدا این روش ها به طور مفصل معرفی می شوند و سپس، با توجه به این که اغلب متغیرهای گسترش ساز بررسی شده در سازمان های آماری ملی، ساختار سلسله مراتبی دارند؛ روش های معرفی شده از قبیل پنهان سازی خانه ای بر اساس دو رهیافت جریان های شبکه ای و مرحله وار را روی جدول های سلسله مراتبی منتشر شده توسط بانک مرکزی ایران با نام "نتایج بررسی کارگاه های بزرگ صنعتی کشور" در سال های 1383 و 1384 برای حفاظت از محرمانگی اطلاعات به کار می بریم
مریم فتحی محسن محمدزاده
در بسیاری از مسایل کاربردی تحلیل جداگانه عوامل نمی تواند میزان ارتباط و تاثیراتی که چندین عامل در پدیده مورد نظر دارند را نمایان سازد، لذا لازم است توزیع توام عوامل مختلف تعیین گردد. چون در بسیاری از پدیده ها همبستگی بین عوامل وجود دارد و پذیره استقلال آن ها معنی دار نیست، نمی توان توزیع توام آن ها را به سادگی از طریق ضرب توزیع های کناری آن ها به دست آوریم. برای این منظور لازم است از بین خانواده های مفصل خانواده هایی که شرایط مدل بندی ساختار وابستگی پدیده را داشته باشند، انتخاب شوند. بنابراین، برای ساخت توزیع چند متغیره از توزیع های کناری مشخص با ساختار وابستگی داده شده پیشنهاد می شود. توزیع های متا-بیضی گون به همین روش ساخته شده اند که توزیع متا-تی جزء این رده است و ساختار وابستگی این توزیع را می توان با تابع مفصل تی مدل بندی کرد. مفصل تی چوله اجازه می دهد تا بتوانیم مشاهدات وابسته ای که ناهمگونی بیشتری دارند را مدل سازی کنیم. ساختار وابستگی این توزیع را می توان با تابع مفصل تی چوله مدل بندی کرد.
سارا ساسانی محسن محمدزاده
داده های فضایی که در زمان های متوالی مشاهده می شوند، داده های فضایی-زمانی هستند و اگر این داده ها از واحدی به واحد دیگر در طول زمان مستقل باشند، داده های پانلی فضایی نامیده می شوند. از جمله مسائل مهم در مدل بندی داده های پانلی وجود همبستگی فضایی بین مشاهدات در هر نقطه از زمان و تغییرپذیری بین واحدهای آزمایشی است که باید به نحوی در مدل لحاظ شوند. این پایان نامه به بررسی مدل های رگرسیونی برای مدل بندی داده های فضایی و داده های پانلی فضایی، آماره های آزمون ضریب لاگرانژ و آزمون به روش رگرسیون کاذب دواندازه ای می پردازد. سپس آزمون هایی برای همبستگی های فضایی و اثرات تصادفی با طرح فرضیه های مختلف توأم، شرطی و حاشیه ای در این مدل ها ارائه می دهد. در مطالعه ای شبیه سازی توان و اندازه آماره آزمون های ضریب لاگرانژ متناظر با فرضیه های مختلف را ارزیابی و مورد مقایسه قرار می دهد. آنگاه در یک مثال کاربردی عوامل موثر بر صادرات محصولات کشاورزی کشورهای عضو اکو بررسی شده و مدل رگرسیونی مناسب برازانده می شود. به علاوه عوامل موثر بر صادرات و واردات محصولات کشاورزی کشورهای عضو اکو و اتحادیه اروپا بررسی و مورد مقایسه قرار می گیرند.
زهرا ناصری محسن محمدزاده
معمولاً به علت اندک بودن داده های آمارگیری در کوچک نواحی، برآوردهای مستقیم ویژگی های مختلف در این نواحی از دقت بالایی برخوردار نیستند. با توجه به افزایش وسیع تقاضا برای تولید آمار های معتبر و دقیق برای کوچک نواحی، سعی شده است که با ارائه رویکردهای مناسب این مشکل حل شود. از طرفی، داده های کوچک نواحی که وابستگی فضایی نیز دارند، می توانند از طریق رگرسیون روی متغیرهای کمکی با جملات خطایی که مستقل یا دارای وابستگی فضایی به نواحی مجاور هستند، مدل شوند. گاهی داده ها دارای تغییراتی ناشی از خطای اندازه گیری هستند که انجام یک تحلیل آماری دقیق را ضروری می سازد. مدل های آمیخته خطی اساس بسیاری از روش های برآورد کوچک ناحیه ای است که با استفاده از منابع مختلف اطلاعات کمکی به برآوردگرهای مستقیم قدرت وام می دهند تا دقت آن ها را افزایش دهند. در این پایان نامه برآورد کوچک ناحیه ای بر اساس مدل خطی با اثرات کوچک ناحیه همبسته فضایی بررسی می شود که در آن ساختار همسایگی فضایی داده ها از طریق ماتریس مجاورت در مدل لحاظ می شود و اطلاعات کمکی فضایی نیز در برآورد کوچک ناحیه ای به کار گرفته می شود. در بخش کاربردی با استفاده از اطلاعات سرشماری کشاورزی سال 1382 استان فارس برآورد کوچک ناحیه ای برای میزان محصولات کشاورزی در شهرستان های این استان را با دو رویکرد مختلف در سطح واحد آماری به دست آورده و دقت آن ها براساس برآورد میانگین توان دوم خطا و اریبی نسبی با هم مقایسه می شوند.
مهدی امیدی محسن محمدزاده
یکی از ابزارهای قوی برای ساخت توزیع های چندمتغیره براساس توزیع های کناری متغیرهای وابسته توابع مفصل هستند.ساختار این توابع به گونه ای است که بر اساس آنها می توان خصوصیات وابستگی متغیرها را به صورت یک تابع تعیین کرد. در تحلیل داده های فضایی لازم است ساختار همبستگی داده ها توسط توابع کواریانس و توزیع چندمتغیره تحقق های میدان تصادفی تعیین شوند. در این رساله برای مدل بندی ساختار همبستگی داده های فضایی با استفاده از توابع مفصل، خانواده ای جدید از توابع مفصل فضایی معرفی می شود و ویژگی های اعتبار آن تعیین می گردد. سپس خانواده معرفی شده با الگوریتم زنبور عسل برای تحلیل داده های بارش در استان خوزستان به کار گرفته خواهد شد. در ادامه الگوهای نقطه ای فضایی با استفاده از توابع مفصل با دو رویکرد فاصله محور و شمارش-فاصله محور مدل بندی می شوند و نقش این توابع در پیشگویی فرآیندهای نقطه ای تعیین می گردد. آن گاه داده های اثرات آلودگی ناشی از حیوانات موزی در سطح شهر مادرید توسط مدل های ارائه شده مورد بررسی قرار می گیرد. برای تحلیل داده های فضایی-زمانی با استفاده از توابع مفصل نیز خانواده ای از توابع کواریانس فضایی-زمانی معتبر ارائه و ثابت می شود برخلاف برخی توابع کواریانس فضایی-زمانی ارائه شده در منابع، فاقد گودال در تاخیرهای فضایی یا زمانی هستند. در ادامه توابع کواریانس معرفی شده برای تحلیل داده های ازن در شهر تهران به کار گرفته و پارامترهای آن ها با استفاده از الگوریتم ژنتیک برآورد می شوند. در پایان دقت و عملکرد الگوریتم های زنبور عسل و ژنتیک در برآورد پارامترهای توابع کواریانس به دست آمده طی مطالعه ای شبیه سازی مورد ارزیابی و مقایسه عددی قرار می گیرد.
محسن محمدزاده پرویز نصیری
چکیده در این پایان نامه ضمن معرفی توزیع وایبل، برآوردگر درستنمایی ماکزیمم و بیز پارامتر مقیاس توزیع وایبل با داده های سانسور شده را با استفاده از توزیع پیشین جفری و توزیع پیشین جفری تعمیم یافته تحت توابع میانگین مربع خطا و میانگین درصد خطا محاسبه و با یکدیگر مقایسه شده اند. در پایان ضمن مقایسه کارایی برآوردگرها نتیجه می شود که پارامتر برآورد شده توزیع وایبل بدست آمده از روش بیز با توزیع پیشین جفری نسبت به پارامتر برآورد شده بدست آمده از روش بیز با توزیع پیشین جفری تعمیم یافته و روش درستنمایی ماکزیمم نتیجه بهتری دارد. هنگامی که حجم نمونه افزایش پیدا می کند میانگین مربع خطا (mse) و میانگین درصد خطا (mpe) دراکثر موارد کاهش می یابد. کلید واژه: توزیع پیشین جفری، توزیع وایبل ، برآورد، روش بیزی; keywords: jeffrey prior distribution; weibull distribution; estimation; bayes method;
فیروز ریواز محسن محمدزاده
چکیده ندارد.
امیر کاوسی دولانقر محمدرضا مشکانی
چکیده ندارد.
مهدی امیدی محسن محمدزاده
چکیده ندارد.
نصرالله ایران پناه محسن محمدزاده
چکیده ندارد.
وحید رضایی تبار محسن محمدزاده
چکیده ندارد.
انور محمدی محسن محمدزاده
چکیده ندارد.
امیر کاوسی دولانقر محسن محمدزاده
در آمار کلاسیک عموما" فرض می شود، مشاهدات حاصل از نمونه ای که از جامعه استخراج می گردد، مستقل از یکدیگرند. در عمل، با موارد زیادی مواجه می شویم که مشاهدات به نوعی به یکدیگر وابسته اند. داده های فضایی، مشاهداتی هستند که وابستگی آنها ناشی از موقعیت آنان در فضای مورد مطالعه است و این وابستگی نوعا"تابعی از فاصله قرار گرفتن مشاهدات از یکدیگر می باشد. در این پایان نامه روشهای برازش واریوگرام که تعیین کننده ساختار همبستگی فضایی مشاهدات هستند و همچنین روش کریگینگ بعنوان بهترین تخمین کننده خطی نااریب داده های فضایی مورد بررسی قرار خواهند گرفت . و در پایان برازش واریوگرام و کریگینگ روی یک مجموعه داده انجام می گیرد.
روشنک علی محمدی محسن محمدزاده
رگرسیون چند جمله ای روشی پارامتری برای برازش منحنی به داده ها می باشد که در آن ارتباط بین متغیر پاسخ و متغیرهای مستقل به صورت چند جمله ای برآورد می گردد. در بسیاری از مواقع در مورد نحوه ارتباط بین متغیرها اطلاع زیادی در دست نیست . در این صورت بهتر است به جای مفروض داشتن یک الگوی پارامتری خاص (مانندچند جمله ای) برای داده ها از روشی استفاده شود که داده ها ماهیت روند خود را بهتر نشان دهند. اسپلاین همواره روشی برای برآورد منحنی است که در آن در مورد شکل منحنی فرضهای قوی اعمال نمی شود و تنها فرض همواری منحنی در نظر گرفته می شود. در این پایان نامه برازش منحنی به دو روش بر اساس معیار مجموع مربعات باقیمانده ها مورد مقایسه عددی قرار گرفته اند. این مطالعه نشان می دهد که برای نمونه های با حجم کوچک و برای هر مقدار انحراف معیار، اسپلاین همواری منحنی بهتری از رگرسیون چند جمله ای به داده ها برازش می دهد، اما برای نمونه های با حجم بزرگ رگرسیون چند جمله ای روشی آسانتر و سریعتر است .
نسرین دخت اعظم جاه محسن محمدزاده
تجزیه و تحلیل رگرسیون روشی برای تعیین بین متغیر پاسخ و متغیرهای مستقل می باشد. برای مواردی که ارتباط بین متغیرها خطی نیست ، مدلهای رگرسیون غیرخطی مورد استفاده قرار می گیرد. عمدتا در این روشها برای نیل به یک پاسخ منحصر به فرد، فرض های محدودکننده ای در نظر گرفته می شود. برای تقلیل اینگونه فرض ها نظریه مدلهای خطی تعمیم یافته نیز بطور قابل ملاحظه ای بسط و گسترش یافته اند. در بسیاری از مواقع نوع ارتباط بین متغیرها مشخص نیست و در این صورت بجای مفروض داشتن یک الگوی خاص پارامتری، از روشی استفاده می شود که داده های ماهیت روند خود را بهتر نشان دهند. مدلهای خطی تعمیم یافته به دو طریق پارامتری و ناپارامتری برای برآورد منحنی بکار برده می شوند. همچنین اسپلاین همواری روشی است برای برآورد منحنی که در تنها فرض همواری منحنی در نظر گرفته می شود. در این پایان نامه با فرض به اینکه پاسخ ها بطور مستقل تعلق به خانواده نمایی هستند، مدلهای خطی تعمیم یافته ناپارامتری مورد بررسی قرار گرفته است و میزان دقت بکارگیری اسپلاین همواری و مدلهای خطی تعمیم یافته بر اساس دو معیار میانگین مجذور خطا و اعتبار متقابل مورد مقایسه عددی قرار گرفته است . این مطالعه نشان می دهد که اسپلاین همواری منحنی بهتری به داده ها برازش می دهد و چنانچه در مدلهای خطی تعمیم یافته ناپارامتری اسپلاین همواری بکار گرفته شود مدل حاصل از دقت بیشتری برخوردار می باشد.
فرانک گودرزی محمدقاسم وحیدی اصل
در این پایان نامه دو مدل برای گرافهای تصادفی بازه ای مطالعه می شوند.
علی آقامحمدی عین الله پاشا
در این پایان نامه پس از ارائه تعاریف مقدماتی در باره آنتروپی ، یکی از مهمترین کاربردهای آنتروپی که روش ماکسیمم آنتروپی است ، بیان می شود. هدف این روش رهیافت ، ابتدا روش برآورد توابع چگالی به وسیله ماکسیمم آنتروپی بررسی شده و سپس نقش اصل ماکسیمم آنتروپی در حل مسئله مهمی در ارتباط با شبکه ترافیک مورد مطالعه قرار می گیرد. همچنین برای برآورد پارامترهای مدل ، روش ماکسیمم آنتروپی تعمیم یافته ، معرفی می شود. در پایان ضمن بیان محدودیتهایی از ضریب همبستگی ، چگونگی کاربرد آنتروپی در اندازه های وابستگی بررسی شده و شاخص های وابستگی مبتنی برآنتروپی برای مرتفع ساختن این محدودیتها ارائه می شود.
علی محمدیان مصمم محسن محمدزاده
قبل از تحلیل آماری داده های فضایی برای شناخت بیشتر آنها تحلیل اکتشافی انجام می گیرد . داده های فضایی دارای نوعی وابستگی هستند که ناشی از موقعیت آنها در فضای مورد مطالعه می باشد. یک روش در تحلیل اکتشافی ، شناسایی داده دورافتاده فضایی است . داده دورافتاده فضایی مشاهده ایست که نسبت به مقادیر همسایگی ناسازگار باشد. اما لزوما با تمام مقادیر جامعه ناسازگار نیست . این داده ها اثرات نامطلوبی روی برآورد پارامترهای مدلهای فضایی دارند. در این پایان نامه روشهای برآورد نیرومند فضایی و شناسایی داده های دور افتاده فضایی و مشکلاتی که در کاربرد آنها بوجود می آیند بررسی می شوند . وقتی بیش از یک داده دورافتاده وجود داشته باشد، بعلت اثرات درون آوری و برون بری این روشها در شناسایی داده دورافتاده موفق نیستند . لذا در این پایان نامه روشی برای شناسایی داده های دورافتاه فضایی ارائه می شود که با الگوریتم جستجوی پیشرو ، مشاهدات را براساس سازگاریشان با مدل مشخصی مرتب می کند، و در نتیجه سبب شناسایی نقاط دورافتاده فضایی چندگانه می شود. به همین دلیل ابتدا روشهای پیش بینی فضایی ارائه شده است . در پایان مجموعه داده های میزان بارندگی در ایران بعنوان یک مثال کاربردی مورد تجزیه و تحلیل فضایی قرار می گیرد.
یدالله واقعی محسن محمدزاده
دراین رساله روشهای مختلف برآورد و مدلسازی تغییرنگار داده های مانا و همسانگرد معرفی شده، سپس برآورد تغییرنگار براساس داده های روندزدوده به عنوان یک راه حل برای مشکل نامانایی ناشی از وجود روند در داده ها مورد بررسی قرار گرفته و استفاده از تابع کواریانس داده های روند زدوده به عنوان یک راه حل برتر که به نحوه روندزدایی داده ها بستگی ندارد مطرح شده است . بعلاوه روشهای مختلف کریگیدن برای پیشگویی فضایی معرفی شده ، و همچنین روشهای مختلف شناسایی و برخورد با داده های فضایی معرفی شده و نتایج کاربرد آنها روی داده های واقعی نشان داده شده است . برای داده های ناهمسانگرد ممکن است یک یا چند پارامتر، یا در حالت کلی تر مدل تغییرنگار به جهت وابسته باشد . به منظور لحاظ کردن ناهمسانگردی در برآورد تغییرنگار مدلهای مختلفی برای ناهمسانگردی ناشی از تغییر یکی از پارامترهای برد یا ازاره ارائه شده است . همچنین یک مدل کلی تر پیشنهاد شده که در آن همه پارامترهای مدل می توانند با جهت تغییر کنند. به کمک شبیه سازی دقت این مدل با مدل همسانگرد مقایسه شده و در پیشگویی به روش کریگیدن به کار رفته است . به منظور نمایش کاربرد روشهای ارائه شده در همه گیری شناسی جغرافیایی بیماریها ساختار همبستگی داده های سل ریوی اسمیر مثبت سالهای 1377 و 1378 در 262 شهرستان کشور، تحت دو فرض همسانگردی و ناهمسانگردی مدلسازی شده و میزان بروز این بیماری در 20 شهرستان فاقد اطلاع با کریگیدن پیشگویی شده است . علاوه بر این فصل آخر به تهیه نقشه آماری بیماریها، که از مباحث مهم در همه گیری شناسی جغرافیایی بیماریهاست ، پرداخته شده و به طور اخص نقشه بروز سل ریوی اسمیر مثبت به روش کریگیدن عام برای سالهای 1377 و 1378 و همچنین نقشه انحراف معیار کریگیدن ارائه شده است .
علی غلامی محسن محمدزاده
گاهی در مسائل آمار کاربردی، لازم است در مورد دم توزیعی که برای آن داده های کمی وجود دارد، استنباط آماری صورت پذیرد. معمولا تابع توزیع مقادیر فرین یک نمونه تصادفی به داده های دم توزیع برازش می شوند. این توابع اغلب به یک پارامتر مجهول مانند بستگی دارند که اندیس توابع توزیع مقادیر فرین نامیده می شود. در این پایان نامه روشهای مختلف برآورد این انیدس بر اساس نمونه تصادفی مورد بررسی قرار می گیرد. بعلاوه برای برآورد پارامتر در توابع توزیع با دم تغییر پذیر منظم، از حالت تجربی توابع تغییرپذیر منظم استفاده می شود. در حالتی که 0< است روش هیل برای پارامتر بکار برده می شود. برای حالتی که r است، دو برآوردگر دی هان و پیکندز معرفی می شوند و خواص سازگاری و رفتار مجانبی آنها مورد بررسی قرار می گیرند. در انتها برآوردگرهای هیل، پیکندز و دی هان بر اساس واریانس مجانبی، کارایی و به روش شبیه سازی مورد مقایسه عددی قرار می گیرند.
محمد قربانی محمد قاسم وحیدی اصل
در این پایان نامه هدف ارائه روشی به نام انتخاب مدل برای خوشه بندی احتمالاتی با استفاده از درستنمایی ارزیابی متقابل است که اولا فرضهای دلخواه اشخاص در مورد معیار تشابه در آن نقشی ندارد ثانیا چون این روش بر اساس مدل است با تجزیه طیفی ماتریش کوواریانس می توان معیارهای ساده ای برای مشخص کردن حجم ، شکل و جهت خوشه ها به دست آورد.ثانیا بر اساس آزمون نسبت درستنمایی توزیع های آمیخته می توان تعداد خوشه ها را تعیین نمود . نهایتا می توان با استفاده از معیارهای bic و درستنمایی ارزیابی متقابل بهترین مدل خوشه بندی را انتخاب نمود.
رضا صالحی محسن محمدزاده
تابع چگالی احتمال یک مفهوم اساسی در آمار است که می توان بوسیله آن رفتار متغیر تصادفی را مورد بررسی قرار داد.این پایان نامه شامل مباحث زیر است: فصل اول تعاریف و مفاهیم اولیه را بررسی می کند.فصل دوم روشهای برآوردگر تابع چگالی احتمال مورد بررسی قرار می گیرد.فصل سوم برآوردگرهای اساسی بحث می شود.فصل چهارم برآوردگرهای b-اسپلاین. فصل پنجم مقایسه برآوردگرهای هسته ای و b-اسپلاین.