نام پژوهشگر: محمد اموت
محمد اموت سهیلا کرباسی
در سال های اخیر، نظر به افزایش میزان داده های جمع آوری شده توسط شرکت ها و سازمان-ها، داده کاوی به عنوان ابزاری مناسب به منظور بهره گرفتن از داده های مذکور و استخراج اطلاعات از داده ها مطرح گردیده است. اما در استفاده از داده کاوی، زمانی که به قابلیت استخراج اطلاعاتی که صاحب داده از آن بی اطلاع است توجه گردد، می توان آن را به عنوان تهدیدی برای حریم خصوصی در نظر گرفت. بنابراین در داده کاوی، حفظ حریم خصوصی افراد از جمله مسائل مهم و پیچیده ای است که در انتشار داده ها به منظور تحلیل، باید بدان توجه داشت. در سال های گذشته تکنیک هایی برای تبدیل یا تغییر داده با هدف حفظ حریم خصوصی پیشنهاد گردیده اند. هدف کلیدی در طراحی این تکنیک ها حفظ کارآمدی داده ها بدون به خطر انداختن حریم خصوصی می باشد؛ لذا مسئله اصلی، چگونگی محافظت از مقادیر داده ای ضمن حفظ الگوهای داده ای موجود در مجموعه های داده می باشد. یعنی صاحبان داده علاوه بر حفظ حریم خصوصی باید قادر باشند صحت نتایج حاصل از داده کاوی را نیز تضمین نمایند. روش های پیشنهادی مرتبط عمدتاً در دو گروه کلی قرار می گیرند که عبارتند از: روش های پریشانی داده، محاسبات چند جانبه امن. حال با توجه به اینکه روش-های فوق قادر به حفظ الگوهای داده ای در مجموعه های داده نمی باشند و استفاده از داده تغییر یافته توسط روش های فوق نیازمند بازسازی توزیع داده اصلی می باشد، امکان به-کارگیری آن ها برای عملیات داده کاوی که نیازمند حفظ الگوهای خاصی در مجموعه های داده می باشند، وجود ندارد. بنابراین روش هایی نیز برای این گروه از عملیات داده کاوی بر پایه تبدیلات داده ای از جمله تبدیل هندسی، فوریه و موجک پیشنهاد گردیدند. در این تحقیق با به کارگیری تبدیل موجک هار، روش تبدیل داده ای پیشنهاد خواهد شد که ضمن پنهان نمودن داده خصوصی، ویژگی های مورد نیاز الگوریتم طبقه بندی k- نزدیک ترین همسایه نیز حفظ می گردد. نتایج بدست آمده از پیاده سازی روش فوق و آزمایشات حاکی از آن است که روش پیشنهادی ضمن افزایش ضریب حریم خصوصی، الگوهای طبقه بندی را نیز در حد قابل قبولی حفظ می نماید.