نام پژوهشگر: حسین محمدی نژاد
مسعود رحیمی مهدی باطنی
امروزه گردآورندگان اطلاعات به ویژه سازمان های آماری با دو مسئله متضاد مواجه اند. از یکسو، بنا به وظیفه قانونی و رشد روزافزون تقاضا برای اطلاعات جمعآوری شده، خود را متعهد به انتشار هر چه گسترده تر و باکیفیت تر اطلاعات به شکل داده های آماری می بینند و از سوی دیگر با توجه به نگرانی عمومی نسبت به افشا اطلاعات شخصی و وظیفه قانونی این سازمانها برای مراقبت از اطلاعات خصوصی پاسخگویان، باید این تضمین را بدهند که ضمن ارائه بیشترین اطلاعات به جامعه، حریم شخصی پاسخگویان در حد معقول حفظ شود. این مسئله زمانی حادتر میشود که مجموعه داده های منتشره توسط روش های داده کاوی، در برابر حملات افشا صفت و هویت قرار میگیرند. بدین منظور برای حل این مسائل، رویکردهایی تحت عنوان p-sensitive k-anonymity, p+-sensitive k-anonymity and (p, α)-sensitive k-anonymityمطرح شد که ایراد الگوریتمهای ارائه شده در این زمینه عدم حفاظت مجموعه داده های خرد در برابر افشاء صفت و مقدار بالای نسبت انحراف است. برای غلبه بر این کمبودها در این پژوهش الگوریتمی سه مرحله ای ارائه شده که مجموعه داده های خرد منتشره را در برابر افشا صفت و هویت محافظت میکند و میزان نسبت انحراف را در طول فرایند گمنام سازی به میزان قابل توجهای کاهش می دهد.