Les entrepôts de données permettent aux analystes de prendre des décisions stratégiques et d’établir des prévisions. La sécurisation des entrepôts est, par conséquent, importante. Par ailleurs, la sécurisation ne doit pas être très restrictive empêchant une exploitation efficace, ni trop souple permettant l’inférence des données interdites. Dans cet article, nous examinons la sécurisation des entrepôts de données à travers une approche basée sur les réseaux bayésiens. Celle-ci comporte deux avantages: elle ne nécessite pas un traitement supplémentaire après chaque phase d’alimentation et n'entraine pas l’altération des données originales.
Securing Data Warehouses: A Semi-automatic Approach for Inference Prevention ...
Vers une approche de sécurisation des entrepôts de données en utilisant les réseaux Bayésiens
1. 1ère Journée sur les Réseaux
Bayésiens et leurs Applications
Vers une approche de sécurisation
des entrepôts de données en
utilisant les réseaux Bayésiens
Salah Triki
Hanene Ben-Abdallah, Jamel Feki (FSEGS)
Nouria Harbi (Université Lyon 2)
JRBA 2010
1
4. Introduction
Sécurisation entrepôts
de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Un entrepôts de données est une collection
de données :
intégrées,
orientées sujet,
non volatiles,
historisées,
disponibles pour l’interrogation et l’analyse
Les analyses concernent différents
domaines: Commerce, Hospitalier …
JRBA 2010
4
5. Sécurisation entrepôts
de données
Introduction
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Architecture
Sources de
données
Outils
d’analyse
ETL
Extraction
Transformation
Chargement
Entrepôt
de
Données
- Augmenter le chiffre d’affaires
- Réduire les dépenses
- Prévoir un stock de médicaments
pour une période donnée de
l’année
JRBA 2010
5
6. Introduction
Sécurisation entrepôts
de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Les entrepôts de données contiennent :
Des données sensibles
Certaines données personnelles
Exigences légales:
HIPPA
GLBA
Sarbanes-Oxley
Safe Harbor
Les organismes doivent respecter ces lois
JRBA 2010
6
8. Introduction
Sécurisation des
entrepôts de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Deux classes de sécurité :
La sécurisation des opérations:
• Contrôler l’accés aux données
• Baser sur des règles d’accés
La prévention contre les inférences :
• Interdire la déduction des données cachées à
partir des données accessibles
JRBA 2010
8
9. Introduction
Sécurisation des
entrepôts de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
L’inference est basée sur :
Des informations
La connaissance de la structure de l’ED
Objectif d’un utilisateur malicieux :
Inférer une information sensible
Moyens utilisés par un utilisateur
malicieux :
Un ensemble d’informations
Un ensemble de requêtes
JRBA 2010
9
11. Introduction
Sécurisation des
entrepôts de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Traiter les requêtes de type Max ou Min
Exemples de requêtes de type Max:
Maximum des ventes par mois et par région
Maximum du chiffre d’affaires par région et
par fournisseur
Maximum des commissions par employé et
par année
JRBA 2010
11
12. Introduction
Sécurisation des
entrepôts de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Approche
Max RécupérerMaxRequête (Requête)
data RécupérerDataRequête (Requête)
RB ConstruireRéseauxBayésiens (data , Max)
Si (∃ Nœud ∈ RB /Pr (Nœud=Max )> seuil)
ALORS
Interdire la requête
SINON
Autoriser la requête
FINSI
JRBA 2010
12
13. Sécurisation des
entrepôts de données
Introduction
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Construction du réseau Bayésien
Pr1 = 1/5
Pr1=1/3
Pr1 = 1
D1=
900
Pr22= 1/3
Pr = 1/5
D2=
500
Max
(D2, D3)
=700
JRBA 2010
Pr3 = 1/5
Pr3 = 1/3
D3=
700
Pr4 = 1/5 Pr5 = 1/5
D4=
200
D5=
300
Max
(D4, D5)
=300
Max
(D1, D2,
D3, D4,
D5) = 900
13 / 22
14. Sécurisation des
entrepôts de données
Introduction
Exemple
Proposition pour la
sécurisation des ED
Habilités à faire des transactions
internationales.
Conclusion et
perspectives
Département
Marketing
Nombre
d’employés du
département
Marketing : 4
ALICE
Décembre 2009
ALICE est
malade
BOB
Chaque employé de
l’entreprise reçoit une
commission sur les
transactions qu’il effectue
Deux types de transactions:
Est-il possible d'inférer le nom de -Nationales
l'employé du département Marketing ayant -Internationales
eu la commission maximale ?
JRBA 2010
14 / 22
15. Sécurisation des
entrepôts de données
Introduction
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Maximum des commissions par Nombre
d'employés et par Département
NB_EMP
4
DEPT_ID
Max Commission
Marketing
900
Finance
950
JRBA 2010
15 / 22
16. Sécurisation des
entrepôts de données
Introduction
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Maximum des commissions par Année et
par Mois
Année
Max Commission
Octobre
850
Novembre
720
Décembre
2009
Mois
900
Le maximum des commissions du
département Marketing est obtenu
au mois de Décembre
JRBA 2010
16 / 22
17. Sécurisation des
entrepôts de données
Introduction
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Maximum des commissions par Année et
par Type de commission
Année
2009
Type de commission
Max Commission
Nationale
840
Internationale
900
Le maximum des commissions du
département Marketing est obtenu au
mois au de Décembre sur une transaction
internationale
BOB est l’employé qui a obtenu le
maximum des commissions
JRBA 2010
17 / 22
18. Sécurisation entrepôts
de données
Introduction
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Commission de ALICE
420
840
440
500
520
740
850
0
720
Commission
de BOB
900
720
Pr = 1/10
900
JRBA 2010
850
900
840
Pr = 1/4
Pr = 1/2
900
L a dernière
requête doit être
interdite
18 / 22
19. Introduction
Sécurisation des
entrepôts de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Avantages
Pas de traitement supplémentaire après
l’alimentation de l’ED
Pas d’altération des données originaux
Inconvénient
Temps de calcul important
JRBA 2010
19 / 22
21. Introduction
Sécurisation des
entrepôts de données
Proposition pour la
sécurisation des ED
Conclusion et
perspectives
Les travaux sur la prévention des
inférences se basent sur l’alteration des
données originales
Utilisation des notions de probabilités afin
de détecter les cas d’inférences
Alléger le travail du réseau Bayésien :
Utiliser les profils des utilisateurs
Utiliser les méthodes statistiques afin de
détecter les données sécurisées
JRBA 2010
21 / 22