ارایه یک روش جدید انتشار دادهها با حفظ محرمانگی با هدف بهبود دقّت طبقهبندی روی دادههای گمنام
نویسندگان
چکیده مقاله:
Data collection and storage has been facilitated by the growth in electronic services, and has led to recording vast amounts of personal information in public and private organizations databases. These records often include sensitive personal information (such as income and diseases) and must be covered from others access. But in some cases, mining the data and extraction of knowledge from these valuable sources, creates the need for sharing them with other organizations. This would bring security challenges in user’s privacy. The concept of privacy is described as sharing of information in a controlled way. In other words, it decides what type of personal information should be shared and which group or person can access and use it. “Privacy preserving data publishing” is a solution to ensure secrecy of sensitive information in a data set, after publishing it in a hostile environment. This process aimed to hide sensitive information and keep published data suitable for knowledge discovery techniques. Grouping data set records is a broad approach to data anonymization. This technique prevents access to sensitive attributes of a specific record by eliminating the distinction between a number of data set records. So far a large number of data publishing models and techniques have been proposed but their utility is of concern when a high privacy requirement is needed. The main goal of this paper to present a technique to improve the privacy and performance data publishing techniques. In this work first we review previous techniques of privacy preserving data publishing and then we present an efficient anonymization method which its goal is to conserve accuracy of classification on anonymized data. The attack model of this work is based on an adversary inferring a sensitive value in a published data set to as high as that of an inference based on public knowledge. Our privacy model and technique uses a decision tree to prevent publishing of information that removing them provides privacy and has little effect on utility of output data. The presented idea of this paper is an extension of the work presented in [20]. Experimental results show that classifiers trained on the transformed data set achieving similar accuracy as the ones trained on the original data set.
منابع مشابه
حفظ محرمانگی در انتشار سری های زمانی پزشکی: k-گمنام سازی چندجزئی ها
صاحبان اطلاعات در حوزه سلامت نیاز دارند تا داده های عملیاتی خود را برای مقاصدی همچون مشاوره یا تحقیقات بیشتر منتشر نمایند. در نتیجه، امروزه حجم زیادی از اطلاعات اشخاص با جزئیات کافی به صورت عمومی در دسترس قرار دارد. این داده ها ممکن است شامل سری های زمانی، همچون سیگنال الکتروکاردیوگرام، نیز باشد. در این موارد حذف شناسه از داده های سری زمانی به تنهایی برای حفظ محرمانگی آنها کافی نیست. زیرا اگر ت...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملیک روش جدید افزایش دقت مکانی تصاویر سنجش از دور با استفاده از جدول جستجو
Different methods have been proposed to increase the image spatial resolution by mixed pixels decomposition. These methods can be divided into two groups. Some research have been attempted to obtain percentages of sub pixels and the other try to obtain their locations. These methods and their problems will be examined in this study. Common methods are reviewed with more emphasis. Finally, a new...
متن کاملمصرف مواد، یک انتخاب منطقى با هدف بهبود زندگى؟
«فرضیّهى انتخاب منطقى» یکى از فرضیّات علم اقتصاد است که پس از مدت کوتاهى به علوم اجتماعى، سیاسى و انسان شناسى نیز راه یافت و در این علوم براى درک و توجیه بعضى از پدیدهها مورداستفاده قرار گرفت. بر اساس این فرضیّه، مبناى تصمیم گیرى افراد، بهبود شرایط، کسب لذت و دفع رنج است. افراد در هر تصمیم گیرى، همواره محاسبات لازم را انجام مى دهند و سپس بر اساس نتیجهى این محاسبات، یک تصمیم منطقى اتخاذ مى...
متن کاملبهبود دقت طبقهبندی با استفاده از تلفیق الگوریتمهای تشخیص هدف در تصاویر ابرطیفی
تصاویر ابرطیفی با قدرت تفکیک طیفی بالا باعث پیشرفتهای وسیعی در حوزههای مختلف سنجش از دور شدهاند. یکی از مهمترین کاربردهای این تصاویر در حوزه کشاورزی و جنگل میباشد. هدف از این تحقیق بهبود طبقهبندی گونههای مختلف گیاهی در منطقه Botswana با استفاده از تلفیق الگوریتمهای تشخیص هدف در تصویر ابرطیفی میباشد. در گام اول الگوریتمهای تشخیص هدف بر روی تصویر ابر طیفی پیشپردازش شده پیادهسازی شد. در...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 15 شماره 3
صفحات 31- 46
تاریخ انتشار 2018-12
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023