نام پژوهشگر: مریم صفرنوراله

شناسایی نقاط دورافتاده در داده های چوله
thesis وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه 1389
  مریم صفرنوراله   مسعود یارمحمدی

چکیده برای تشخیص داده های منظم از داده های دورافتاده می توان از فواصل ماهالانوبیس استفاده کرد و با محاسبه ی مقدار برش بر مبنای توزیع فواصل بدست آمده، نقاط دورافتاده را تشخیص داد اما این در صورتی است که فرض نرمال بودن داده ها برقرار باشد لذا درمورد داده های نامتقارن این روش کارآمد نمی باشد. ازجمله روشهایی که برای تشخیص داده های دورافتاده در توزیع های چوله استفاده می شود. رسم نمودارجعبه ای تعدیل یافته و نمودار کیسه ای و همچنین محاسبه ی معیارهای دورافتادگی تعدیل یافته و مقدار برش می باشد. دراین تحقیق پس از معرفی مفاهیم مورد نیاز در تشخیص داده های دورافتاده، روشهای کشف این داده ها در مورد داده های چوله با استفاده از روشهای شبیه سازی مورد بحث و بررسی قرار می گیرد. در این راستا مقدار دورافتادگی تعدیل یافته ی هر مشاهده را بدست آورده و داده هایی که مقدار دورافتادگی آنها از یک حد استاندارد و مشخص بالاتر باشد به عنوان داده های دورافتاده در نظر می گیریم.