نام پژوهشگر: ناهید تحقیقی نیا
ناهید تحقیقی نیا صادق رضایی
چکیده در این پروژه با عنوان "یک توزیع سه پارامتری جدید برای طول عمر" که ترکیبی از توزیع های نمایی تعمیم یافته و هندسی است، معرفی می شود. این توزیع قابل انعطاف دارای نرخ شکست صعودی، نزولی و صعودی-نزولی می باشد. در این مجموعه،ویژگی های گوناگون این توزیع معرفی شده مورد بحث و بررسی قرار می گیرد. با استفاده از الگوریتم em و برآوردگرهای ماکسیمم درستنمایی، پارامترها را برآورد کرده، به منظور ارزیابی صحت تقریب واریانس و کوواریانس برآوردگرهای ماکسیمم درستنمایی از شبیه سازی استفاده می شود. چند نتیجه تجربی برای مجموعه داده های واقعی ارائه گردیده است. کلمات کلیدی: ترکیب، نرخ شکست نزولی، توزیع نمایی تعمیم یافته، الگوریتم em ، توزیع های طول عمر، برآوردگر ماکسیمم درستنمایی. مقدمه در بسیاری از مسائل زیستی، مدیریت و مهندسی مطالعه توزیع طول عمر یک فعالیت، فرآیند یا موجود از اهمیت بسزایی برخوردار است. به طور کلی زمانی از یک جمعیت انتظار داریم نرخ شکست نزولی داشته باشد که عملکرد آن جمعیت در طول زمان مشخص شده باشد و از عناوینی نظیر "سفت کاری" در اصطلاح مهندسی، "مصونیت" در اصطلاح زیست شناسی و در بعضی مواقع اصطلاح وسیع تر"مرگ و میر نوزادان" استفاده می شودتا نشان دهنده پدیده نرخ شکست نزولی باشد. چند مدل پارامتری برای زمان های شکست به صورت موفق ارائه گردیده اند. توزیع های دارای نرخ شکست نزولی در کارهای لوماکس (1954)، پروشان (1963)، بارلو(1963)، بارلو و مارشال(1964,1965)، مارشال و پروشان (1965)، کزولینو (1968)، داهیا و گرلند (1972)، نولتی و همکاران(1980)، ساندرز و مایر(1983)، ناسار(1988)، گلسر(1989)، گارلند و ستازن(1994)، آدامیدیس و لوکاس (1998)، کاس(2007)، طهماسبی و رضایی (2008) و فلیپ(2009) مورد بحث و بررسی قرار گرفته است و یک توزیع وایبل معکوس تعمیم یافته سه پارامتری با نرخ شکست نزولی و تک مدی مورد مطالعه قرار گرفته است. دیمیتراکوپولو در سال 2007 یک توزیع طول عمر سه پارامتری صعودی، نزولی و صعودی-نزولی همراه با نودار تابع نرخ شکست ارائه داده است. مدل های آنها شامل توزیع وایبل به عنوان حالت خاص می باشد. این پایان نامه از بخش های زیر تشکیل شده است: در بخش دوم ، یک توزیع جدید مرکب از توزیع های نمایی تعمیم یافته و هندسی، معرفی می شود. در بخش سوم، به بررسی ویژگی های گوناگون این توزیع پرداخته، در بخش چهارم، برآورد پارامترها با استفاده از روش ماکسیمم درستنمایی و الگوریتم em، در بخش پنجم نتایج شبیه سازی و در بخش ششم نتایج تجربی توزیع پیشنهادی بر اساس مجموعه داده های واقعی ارائه می گردد. توزیع پیشنهادی فرض کنید y1, . . . , yz متغیرهای تصادفی مستقل و هم توزیع دارای توزیع نمایی تعمیم یافته با تابع چگالی fy (y; ?, ?) = ??e^??y(1 ? e^??y)^??1, که ?و ?مثبت اند، باشند. نیز فرض می کنیم zمتغیری تصادفی و دارای توزیع هندسی با تابع احتمال زیر باشد: (1 ? p)p^z?1که z و y متغیرهای تصادفی مستقل می باشند. با تعریف x = min{y1, . . . , yz}، تابع چگالی شرطی و تابع چگالی احتمال x عبارت است از: fx|z(x|z; ?, ?) = ??ze^??x(1 ? e^??x)^??1[1 ? (1 ? e^??x)^?]^z?1 and marginal pdf of x is fx(x; p, ?, ?) = ??(1 ? p)e^??x(1 ? e^??x)^??1{1 ? p[1 ? (1 ? e??x)?]}^-2 , x > 0. ویژگی های توزیع با توجه به تابع چگالی احتمال توزیع geg، مقدار مد تابع در x=0 برابر با بی نهایت و به ازای ?، مد تابع بابر است با ??(1 ? p)^?1 . نمودار تابع گالی توزیع برای < ?، به صورت یک تابع تک مدی و چوله به سمت راست و به ازای ? > ، نمودار تابع چگالی احتمال توزیع نزولی است. به ازای ?=1 درتابع چگالی تعریف شده ، تابع چگالیeg، آدامیدیس و لوکاس (1998) حاصل می شود. نرخ شکست به ازای ? < 1 برابر با ?،به ازای ? < 1 برابر با beta/1-p و به ازای ? > 1 برابر با صفر است. برآورد پارامترها برآورد با استفاده از برآوردگر ماکسیمم درستنمایی به منظور برآورد پارامترهای توزیع نمایی تعمیم یافته-هندسی با روش ماکسیمم درستنمایی، نیاز به محاسبه نمودن تابع درستنمایی داریم. لذا تابع درستنمایی توزیع geg با استفاده از یک نمونه مشاهده شده به اندازهn ، yobs =(xi; i = 1, . . . , n)که با?(p, ?, ?; yobsنشان می دهیم، بدست می آوریم. به منظور برآورد پارامترها کافی ست ??/?? = 0 و ??/?p = 0 و ??/?? = 0را بدست می آوریم. حال برآورد پارامترها را با استفاده از روش الگوریتم em توضیح می دهیم. برآورد پارامترها از طریق روشmle نیازمند روش های پیچیده عددی است.الگوریتم نیوتن-رافسون یک روش استاندارد جهت برآورد پارامترها می باشد.کافی ست از لگاریتم تابع درستنمایی، مشتق مرتبه دوم گرفته شود. الگوریتم em یک ابزار بسیار توانمند در بررسی مسائلی است که در آن داده ها کامل نیست (دمپستر(1977)، لشلان و کریشنان ((1997.) الگوریتم emیک روش با تکرار است که در هر تکرار، داده های گم شده را با مقادیر برآورد شده جایگزین نموده و برآوردهای جدیدی بدست می آورد و نسبتاً به کندی همگرا می شود. این الگوریتم توسط نویسندگانی همچون آدامیدیس و لوکاس (1998)، آدامیدیس(1999)، کاس در سال 2007 و طهماسبی و رضایی در سال 2008 مورد بحث و بررسی قرار گرفته است. برای بدست آوردن برآورد پارامترهای توزیع gegبا استفاده از الگوریتم em ، ابتدا نیازمند تابع چگالی توزیع، زمانی که داده ها کامل فرض شده اند، یعنی f(x, z; p, ?, ?) هستیم. مرحلهe الگوریتمem، یعنی محاسبه امید ریاضی شرطی یعنی (z|x; p(h), ?(h), ?(h)), است. که در آن p(h) ?(h), ?(h)برآورد جاری پارامترهای(p, ?, ?) گام دوم الگوریتم، در این مرحله تابع درستنمایی را به ازای یک نمونه مشاهده شده به اندازهn، بدست می آوریم. در این مرحله کافی ست در برآوردهای بدست آمده به روشmle، بجایz، امید شرطی آن را جایگزین کنیم. واریانس و کوواریانس مجانبی برآوردگرهای ماکسیمم درستنمایی با انتخاب یک نمونه به اندازه کافی بزرگ از توزیعgeg، برآوردگرهای ماکسیمم درستنمایی تقریباً دارای توزیع نرمال بامیانگین ?و ماتریس واریانس-کوواریانس برابر با معکوس ماتریس اطلاع موردانتظار یعنی j(?) = e(i; ?) می باشد. که در آن (i = i(?; yobs ماتریس اطلاع مشاهده شده ، با مشتق گیری مرتبه دوم از معادله درستنمایی نسبت به پارامترها و منفی کردن نتایج، یعنی iij =??^2?/??i??jکه i, j = 1, 2, 3 بدست آورده می شوند.