نام پژوهشگر: امیرحسین شهسواری

پنهان سازی قواعد وابستگی حساس در پایگاه داده های متمرکز با استفاده از روش های مبتنی بر تحریف
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شهید مدنی آذربایجان - دانشکده کامپیوتر و فناوری اطلاعات 1394
  امیرحسین شهسواری   شهرام حسین زاده

پیشرفت های اخیر در فناوری اطلاعات و رسانه های ذخیره سازی دیجیتال، نگه داری حجم عظیمی از داده ها را با هزینه ی اندک امکان پذیر نموده است. بسیاری از صاحبان داده ها از این فرصت استفاده می کنند و به دلایل مختلفی (نظیر همکاری یک سازمان با سازمان های دیگر)، دست به انتشار داده های دیجیتال خود می زنند. از سوی دیگر، استفاده ی سودجویانه ی افراد و یا سازمان های رقیب از ابزارهای داده کاوی جهت استخراج دانش حساس از پایگاه داده ی منتشر شده می تواند منافع و حریم خصوصی صاحبان داده ها را با خطر مواجه سازد. به این ترتیب، فیلد تحقیقاتی جدیدی تحت عنوان حفظ حریم خصوصی در داده کاوی از اهمیت خاصی برخوردار شده است. در این پایان نامه روی پنهان سازی قواعد وابستگی به عنوان یکی از مهم ترین بخش های تحقیقاتی حفظ حریم خصوصی در داده کاوی تمرکز شده است و دو روش مبتنی بر تحریف به نام های fmarh و wmarh برای پنهان سازی قواعد وابستگی حساس در پایگاه داده های متمرکز ارائه شده است. در این روش ها برای اولین بار از مرحله ی استخراج قواعد وابستگی برای مقداردهی برخی از متغیرهای مورد نیاز در بخش پنهان سازی کمک گرفته شده است تا زمان اجرای الگوریتم ها کاهش یابد. در روش اول، تراکنش های حساسی برای ایمن سازی انتخاب می شوند که طول کوتاه تری دارند. برای انتخاب آیتم قربانی در این روش از سه پارامتر برای کاهش میزان قواعد گم شده استفاده می شود. در روش دوم که از جمله روش های پنهان سازی چند قانونی به شمار می رود، برای انتخاب تراکنش ها علاوه بر در نظر گرفتن طول، میزان حساسیت آن ها نیز مورد توجه قرار می گیرد و آیتم قربانی با بهره گیری از پنج پارامتر به نحوی انتخاب می شود که ضمن پنهان سازیِ هم زمان قوانین مختلف، تأثیر کمتری روی قواعد غیرحساس بگذارد و از آشکار شدن مجدد قوانین حساسی که در مراحل گذشته پنهان شده بودند نیز جلوگیری به عمل آید. نتایج آزمایشات نشان می دهد ضمن آن که روش های fmarh و wmarh از سرعت بالایی برخوردار هستند از لحاظ اثرات جانبی نیز کارایی مناسبی در برابر روش های شناخته شده ی algo 2b، mdsrrc و sif-idf دارند.