نام پژوهشگر: یگانه دهقانی
یگانه دهقانی علیرضا فخارزاده جهرمی
یکی از ارکان اصلی دانش داده کاوی، شناسایی داده های ناسازگار در مجموعه ی داده ها است. این پایان نامه به بررسی موضوعی روش شناسایی داده های ناسازگار در بعد زیاد بر مبنای شناسایی در زیرفضاهای موازی-محور (sod)، که در ابعاد بالا از کارایی نسبتا خوبی برخوردار است، اختصاص دارد. از دلایل برتری این روش آن است که در این روش در ابعاد بالا، داده های ناسازگار می توانند خیلی از دیگر داده ها فاصله بگیرند. این روش، یک روش موضعی است که ناسازگار بودن داده ها را بر اساس زیرمجموعه ای از کل داده ها بررسی می کند. پس از معرفی و بررسی روش، آن را بر روی داده های قطعی مربوط به تومور اجرا و نتایج مورد تحلیل قرار می گیرد. تحلیل پایداری روش مذکور با روش های مشابه دیگر نیز مقایسه شده است. روش مذکور برای شناسایی داده های فازی ناسازگار نیز گسترش داده شده است. برای این منظور، 4 آزمون براساس سه نوع متریک متفاوت، انجام شده است. بدین ترتیب برای هر سه آزمون اول، توسط نرم افزار متلب r2010a v7.14.0.739، تعداد 100 داده ی فازی مثلثی متقارن نرمال به طوری تولید شده اند که تعداد 5 داده ی آخر آن، داده ی ناسازگار است. پس از اجرای الگوریتم براساس سه نرم متفاوت، در بهترین حالت از پارامترهای مورد استفاده در الگوریتم، تمامی 5 داده ی ناسازگار به درستی شناسایی شده اند. در آزمون چهارم توسط نرم افزار متلب r2010a v7.14.0.739، تعداد 200 داده به گونه ای تولید شده اند در حالی که اطلاع دقیقی از تعداد داده های ناسازگار نداریم. سپس الگوریتمsod برای مجموعه داده های فازی بدون آگاهی از تعداد داده های ناسازگار، اجرا شده است. آزمون های عددی نشان دادند که در شناسایی داده های ناسازگار از یک مجموعه ی فازی تصادفی، اعم از آگاهی یا عدم آگاهی از داده های ناسازگار، الگوریتم تعمیم یافته با موفقیت عمل کرده است. همچنین کوتاه بودن زمان اجرای برنامه در استفاده از هر سه نرم از مزایای مهم الگوریتم تعمیم یافته است