Approche guidée pour l'anonymisation de bases de données
نویسندگان
چکیده
RESUME. L’anonymisation des données personnelles requiert l’utilisation d’algorithmes complexes permettant de minimiser le risque de ré-identification tout en préservant l’utilité des données. Dans cet article, nous décrivons une approche fondée sur les modèles qui guide le propriétaire des données dans son processus d’anonymisation. Le guidage peut être informatif ou suggestif. Il permet de choisir l’algorithme le plus pertinent en fonction des caractéristiques des données mais aussi de l’usage ultérieur des données anonymisées. Le guidage a aussi pour but de définir les bons paramètres à appliquer à l’algorithme retenu. Dans cet article, nous nous focalisons sur les algorithmes de généralisation de microdonnées. Les connaissances liées à l’anonymisation tant théoriques qu’expérimentales sont stockées dans une ontologie.
منابع مشابه
Evolution et personnalisation des analyses dans les entrepôts de données - Une approche orientée utilisateur
RÉSUMÉ. Dans le cadre d’une collaboration avec LCL-Le Crédit Lyonnais, nous avons conçu un entrepôt de données à partir des sources de données de l’établissement bancaire pour répondre aux besoins d’analyse des utilisateurs concernant les opérations marketing. Cependant, ces besoins sont amenés à évoluer rapidement. Dans cet article, nous proposons alors une approche originale d’évolution du mo...
متن کاملDécouverte de proportions analogiques dans les bases de données : une première approche
Résumé. Cet article présente un nouveau cadre pour la découverte de connaissances basé sur la notion de proportion analogique qui exprime l’égalité des rapports entre les attributs de deux paires d’éléments. Cette notion est développée dans le contexte des bases de données pour découvrir des parallèles dans les données. Dans un premier temps, nous donnons une définition formelle des proportions...
متن کاملTechniques de fouille de données pour la réécriture de requêtes en présence de contraintes de valeurs
Résumé. Dans cet article, nous montrons comment les techniques de fouilles de données peuvent résoudre efficacement le problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. A partir d’une formalisation du problème de la réécriture dans le cadre de la logique de description ALN (Ov), nous montrons comment ce problème se rattache à un cadre de découverte d...
متن کاملEstimation de similarité entre séquences de descripteurs à l'aide de machines à vecteurs supports
Les bases de données contenant des séquences multimédia se trouvent maintenant partout. Archives de l’INA, balladodiffusion (podcast), production et partage de vidéo font désormais partie de notre quotidien. Faire des recherches par le contenu dans ces bases où l’information est en flux est difficile, notamment à grande échelle. Une des questions fondamentales concerne la mesure de similarité e...
متن کاملFouille de données relationnelles dans les SGBD
Les travaux sur la fouille de données relationnelles prennent leur essor dans le domaine de la Programmation Logique Inductive (PLI). Bien qu’efficace en terme d’extraction de connaissances, la PLI est inadaptée pour traiter des bases de données relationnelles de grande taille. Dans cet article nous présentons une nouvelle approche qui apporte une solution efficace à la fouille de données relat...
متن کامل