نام پژوهشگر: طاهره نصراله زاده ممقانی
طاهره نصراله زاده ممقانی صادق رضایی
استخراج الگوها و مدل های مطلوب از مجموعه داده های بزرگ توجه بسیاری را در رشته های مختلف بخود جلب کرده است، در این خصوص استخراج اطلاعات مفید از پایگاه های داده و داده کاوی دو زمینه جالب توجه برای محققین در شناسایی الگوها، آمار، هوش مصنوعی و خصوصاً محاسبات در سطوح بالا ایجاد کرده است.در این پایان نامه یک روش کارا و استوار به نام تجزیه کلاس رگرسیونی آمیخته برای استخراج کلاس های رگرسیونی در مجموعه داده های بزرگ خصوصاً در شرایط آلوده ارایه می گردد. کلاس رگرسیونی که به عنوان یک زیر مجموعه از مجموعه داده هایی تعریف می شود که موضوع اصلی در مدل رگرسیونی است مطرح می گردد, آنگاه یک مجموعه از داده های درونی به هر کدام از این کلاس های رگرسیونی اختصاص می یابد و در نهایت مدل های رگرسیونی معنی دار در مجموعه داده ها تعیین می گردد. مجموعه داده های بزرگ به عنوان یک جامعه آمیخته مورد بحث قرار می گیرد که در آن تعداد زیاد و متناهی کلاس رگرسیونی و ساختارهای دیگر, وجود دارد. از سویی می دانیم که برآوردگرهای استوار کلاسیک تنها کمتر از 50 درصد از داده های پرت را کنترل می کنند, اما شرایطی پیش می آید که در آن بیش از 50 درصد از داده ها پرت باشد. در این پایان نامه همچنین یک برآوردگر بسیار استوار برای مقابله با چنین مشکلاتی تحت عنوان, برآوردگر تجزیه چگالی رگرسیونی ارایه می گردد. این برآوردگر در مقابل کسر بالایی از داده های آلوده حتی بیش از 50 درصد مقاوم است, این موضوع در یک مثال شبیه سازی شده بخوبی عمل می کند. بخش اعظم این پایان نامه بر اساس مقاله 24 توسط ma , leung و luo در سال 2006 می باشد که در فهرست مراجع نیز به آن اشاره شده است.