حسین محمدی نژاد

نام پژوهشگر: حسین محمدی نژاد

توسعه مدل k-anonymity به منظور حفظ حریم خصوصی بر روی داده های خرد

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر 1393
مسعود رحیمی مهدی باطنی

امروزه گردآورندگان اطلاعات به ویژه سازمان های آماری با دو مسئله متضاد مواجه اند. از یکسو، بنا به وظیفه قانونی و رشد روزافزون تقاضا برای اطلاعات جمعآوری شده، خود را متعهد به انتشار هر چه گسترده تر و باکیفیت تر اطلاعات به شکل داده های آماری می بینند و از سوی دیگر با توجه به نگرانی عمومی نسبت به افشا اطلاعات شخصی و وظیفه قانونی این سازمانها برای مراقبت از اطلاعات خصوصی پاسخگویان، باید این تضمین را بدهند که ضمن ارائه بیشترین اطلاعات به جامعه، حریم شخصی پاسخگویان در حد معقول حفظ شود. این مسئله زمانی حادتر میشود که مجموعه داده های منتشره توسط روش‏ های داده کاوی، در برابر حملات افشا صفت و هویت قرار میگیرند. بدین منظور برای حل این مسائل، رویکردهایی تحت عنوان p-sensitive k-anonymity, p+-sensitive k-anonymity and (p, α)-sensitive k-anonymityمطرح شد که ایراد الگوریتمهای ارائه شده در این زمینه عدم حفاظت مجموعه داده های خرد در برابر افشاء صفت و مقدار بالای نسبت انحراف است. برای غلبه بر این کمبودها در این پژوهش الگوریتمی سه مرحله‏ ای ارائه شده که مجموعه داده های خرد منتشره را در برابر افشا صفت و هویت محافظت میکند و میزان نسبت انحراف را در طول فرایند گمنام سازی به میزان قابل توجه‏ای کاهش می دهد.