نام پژوهشگر: طاهر ره گوی
طاهر ره گوی رضا منصفی
یکی از مسائل مهم دنیای امروز استخراج دانش از پایگاه داده های بسیار بزرگ است. داده کاوی این امکان را فراهم کرده است که بتوان به صورت خودکار اطلاعات مفیدی را از پایگاه داده های بسیار بزرگ استخراج نمود. اطلاعات استخراج شده توسط داده کاوی ممکن است موجب نقض حریم خصوصی افراد و سازمان ها گردد. با افزایش موارد نقض حریم خصوصی توسط داده کاوی، نگرانی ها در میان شهروندان برای حریم خصوصی نیز افزایش روزافزون داشته است. لذا در سال های اخیر حفظ حریم خصوصی در داده کاوی به عنوان مبحثی حیاتی، مورد توجه جامعه علمی قرار گرفته است. یکی از روش های بسیار مهم در داده کاوی، کاوش قوانین انجمنی می باشد. مبحث حفظ حریم خصوصی در کاوش سودمندی که یکی از مدل های کاوش قوانین انجمنی است، اخیراً در محافل علمی مطرح گردیده و تاکنون دو الگوریتم مکاشفه ای برای آن ارائه شده است. اگرچه این الگوریتم ها به خوبی می توانند حریم خصوصی داده ها را حفظ کنند اما داده های تولید شده توسط این الگوریتم ها از کیفیت مناسبی برخوردار نیستند. از این رو هدف اصلی این تحقیق بر روی طراحی و پیاده سازی روش ها و الگوریتم های جدید و کارآمد برای حفظ حریم خصوصی در کاوش سودمندی تمرکز دارد. مسأله یافتن راه حل بهینه برای پاک سازی پایگاه داده از مجموعه-اقلام حساس، یک مسأله برنامه ریزی غیرخطی عدد صحیح است و راه حل کارآمد ریاضی برای حل آن وجود ندارد. روش-های پیشنهادی برای حل مسأله فوق در سه دسته ی مکاشفه ای، تکاملی و دقیق ارائه شده اند. الگوریتم های مکاشفه ای بر اساس قوانین شهودیِ کلی می کوشند که فرآیند پاک سازی را با وارد نمودن کم ترین آسیب به کیفیت داده ها، به اتمام برسانند. الگوریتم های تکاملی پیشنهادی تلاش می کنند که با بهینه سازی معیارهای کیفیت داده عملیات پاک-سازی را انجام دهند. در نهایت الگوریتم های دقیق، مدل ساده شده ای از مسأله فوق که با روش های ریاضی قابل حل باشد را به عنوان تقریبی از مسأله اصلی در نظر گرفته و با حل آن امید دارند که عملیات پاک سازی را با تولید داده-های با کیفیت بالا به انجام برسانند. نتایج آزمایشات ارائه شده در این تحقیق، برتری چشم گیرِ روش های پیشنهادی بر روش های موجود کنونی را نشان می دهد.