نام پژوهشگر: پردیس تقوی
پردیس تقوی محمدرضا کیوان پور
با پیشرفت های اخیر در فرایند ارتباطات و ذخیره سازی داده، میزان زیادی از اطلاعات جمع آوری و ذخیره شده است. چنین میزان گسترده ای از داده ها فرصت های زیادی برای کشف دانش ایجاد می کنند. اگرچه، اطلاعات تقریبا همیشه تحت برخی ملاحظات حفظ حریم خصوصی جمع آوری شده است، اما در سال های اخیر افزایش نگرانی ها درمورد محرمانگی باعث شده است که صاحبان داده ها تمایل به اشتراک گذاری داده هایشان و ایجاد انباره های داده ی اشتراکی نداشته باشند. وجود محدودیت مذکور در جمع آوری داده ها می تواند در میزان موفقیت فرایند داده کاوی اثر منفی داشته باشد، بنابراین انجام داده کاوی با حفظ محرمانگی مسأله پژوهشی مهمی تلقی می شود. یکی از مهم ترین راهکارها جهت حفظ محرمانگی در داده کاوی، روش های مبتنی بر آشفتگی داده است. چالش عمده این دسته از روش ها عدم تعادل مطلوب بین حفظ محرمانگی و دقت داده هاست. براین اساس، تحقیقاتی مبتنی بر روش های تجزیه ماتریس، در راستای رفع چالش فوق و ایجاد تعادل مناسب بین حفظ محرمانگی داده و حفظ سودمندی داده ها صورت گرفته است. اما معمولا در روش های مبتنی بر تجزیه ماتریس، همه داده ها با درجه یکسانی تحریف می شوند، در صورتیکه تمام داده ها اهمیت یکسانی برای داده کاوی ندارند و همه آنها نیازمند یک سطح محرمانگی نیستند. در این پژوهش، در راستای بهبود روش های مبتنی بر آشفتگی، مدلی جدید ارائه شده است. در روش پیشنهادی با استفاده از روش های انتخاب ویژگی تمام ویژگی های مجموعه ی داده بر حسب اهمیتشان برای داده کاوی، به دو گروه تقسیم شده و هر کدام از این گروه ها با مرتبه ی متفاوتی آشفته می شوند. همچنین به منظور جبران کاهش دقت ناشی از تحریف داده ها، از روش های شفاف سازی استفاده شده است. آزمون های مختلف و تحلیل نتایج حاصل از آنها نشان می دهد که روش پیشنهادی ارائه شده، نسبت به روش های پیشین، موجب بهبود سطح حفظ محرمانگی داده ها و دقت نتایج داده کاوی شده است. به بیان دیگر روش پیشنهادی تعادل مطلوبی را بین حفظ محرمانگی و سودمندی داده ها ایجاد می کند.