2. Plan
• Introduction
• Définition
• Objectifs
• Historique
• Structure du Data Warehouse
• Concept du Data Warehouse
• Les aspects techniques
• SGBD et DW
• Conclusion
Free Powerpoint Templates
Page 2
4. Introduction
• On qualifie d'informatique décisionnelle (en
anglais « Business intelligence », parfois
appelé tout simplement « le décisionnel »)
l'exploitation des données de l'entreprise dans le
but de faciliter la prise de décision par les
décideurs, c'est-à-dire la compréhension du
fonctionnement actuel et l'anticipation des
actions pour un pilotage éclairé de l'entreprise.
Free Powerpoint Templates
Page 4
5. Introduction
• Les outils décisionnels comme le Data
Warehouse et le Data Mining sont basés
sur l'exploitation d'un système
d'information décisionnel alimenté grâce à
l'extraction de données diverses à partir
des données de production, d'informations
concernant l'entreprise ou son entourage
et de données économiques.
Free Powerpoint Templates
Page 5
7. Définition
W.B.Inmon
« Le data Warehouse est une collection
de données orientées sujet, intégrées,
non volatiles et historisées,
organisées pour le support d’un
processus d’aide à la décision »
Free Powerpoint Templates
Page 7
9. Objectifs d’une Data Warehouse
• Intégrer différentes bases de données
opérationnelles;
• Permettre l’accès aux informations historisées;
• Fournir des outils d ’analyse sur ces données;
• Résumer les données;
• Réconcilier des données inconsistantes.
Free Powerpoint Templates
Page 9
11. Historique du Data Warehouse
• Années 1960 : Genral Mills et l‘Université Dartmouth,
dans un projet conjoint, créent les termes "faits" et
"dimensions".
• 1983 : Teradata introduit dans sa base de données
managériale un système exclusivement destiné à la
prise de décision.
• 1988 : Barry Devlin et Paul Murphy publient l'article
"Une architecture pour les systèmes d'information
financiers" ("An architecture for a business and
information systems") où ils utilisent pour la première fois
le terme "Datawarehouse".
Free Powerpoint Templates
Page 11
12. Historique du Data Warehouse
• 1990 : Red Brick Systems crée Red Brick
Warehouse, un système spécifiquement dédié à la
construction de l'Entrepôt de données.
• 1991 : Bill Inmon publie Building the Data
Warehouse (Construire l'Entrepôt de Données).
• 1995 : Le Data Warehousing Institute, une
organisation à but lucratif destinée à promouvoir le
datawarehousing, est fondé.
• 1996 : Ralph Kimball publie The Data Warehouse
Toolkit (La boîte à outils de l'Entrepôt de données).
Free Powerpoint Templates
Page 12
14. Structure du DATA WAREHOUSE
Le Data Warehouse se structure en quatre
classes de données, organisées selon un
axe historique est un axe synthétique.
Free Powerpoint Templates
Page 14
15. Structure du DATA WAREHOUSE
Les données agrégées Les méta- données
DATA WAREHOUSE
Les données détaillées Les données historisées
Free Powerpoint Templates
Page 15
16. Données détaillées
• Elles reflètent les évènements les plus
récents.
• Les données provenant des systèmes
de production sont intégrées à ce
niveau.
Free Powerpoint Templates
Page 16
17. Données agrégées
• Elles correspondent à des éléments d'analyse
représentatifs des besoins des utilisateurs.
• Ce sont donc des données déjà traitées par le
système et représentant un premier résultat
d'analyse et de synthèse des données
contenues dans les systèmes de production.
• Elles doivent être facilement accessibles et
compréhensibles.
Free Powerpoint Templates
Page 17
18. Données historisées
• Chaque nouvelle insertion dans le Data
Warehouse ne détruit pas les anciennes
valeurs mais cré une nouvelle insertion.
Free Powerpoint Templates
Page 18
19. Méta-données
• Il s'agit « de données sur les données ».
Elles décrivent les règles ou processus
attachés aux données du système.
• Il permet aussi de faciliter la recherche de
données.
Free Powerpoint Templates
Page 19
21. Concept du Data Warehouse
Orientée sujet Données intégrées
DATA WAREHOUSE
Données non volatiles Données datées
Free Powerpoint Templates
Page 21
22. Concept du Data Warehouse
• Données orientées sujet :
• Regroupe les informations des différents métiers
• Ne tiens pas compte de l’organisation
fonctionnelle des données
Ass. Vie Ass. Auto Ass. Santé
Client
Police
Free Powerpoint Templates
Page 22
23. Concept du Data Warehouse
• Données intégrées :
• Normalisation des données
• Définition d’un référentiel unique
h,f
1,0 h,f
homme, femme
GBP
EUR
CHF
USD Free Powerpoint Templates
Page 23
24. Concept du Data Warehouse
• Données non volatiles :
• Traçabilité des informations et des décisions
prises
• Copie des données de production
Bases de production Entrepôts de données
Ajout
Suppression
Accès
Modification Chargement
Free Powerpoint Templates
Page 24
25. Concept du Data Warehouse
• Données datées :
• Les données persistent dans le temps
• Mise en place d’un référentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Répertoire Répertoire
Base de Nom Ville Nom Ville
production
Dupont Paris Dupont Marseille
Durand Lyon Durand Lyon
Calendrier Répertoire
Entrepôt Code Année Mois
Code Année Mois
de
1 2005 Mai 1 Dupont Paris
données
2 2006 Juillet 1 Durand Lyon
Free Powerpoint2Templates
Dupont Marseille Page 25
26. Les aspects
techniques
Free Powerpoint Templates
Page 26
27. Les aspects techniques du DW
1. Les bases de données
• OLAP (On-Line Analitical Processing)
• C’est un mode de stockage prévu pour l’analyse
statistique des données contenues dans la base;
• Il est appliqué à un modèle virtuel de
représentation de donnée appelé cube ou
hypercube OLAP.
Free Powerpoint Templates
Page 27
28. Les aspects techniques du DW
• OLTP (On-Line Transactional Processing)
• C’est un mode de stockage fait pour les systèmes
opérationnels;
• Ils supportent très bien une utilisation
transactionnelle de la base de données;
• À ce mode de stockage est associé des requêtes
type courtes et ne demandant pas beaucoup de
ressource du côté du serveur de la base de
données.
Free Powerpoint Templates
Page 28
29. Les aspects techniques du DW
2. Modélisation
• Les tables de dimensions
- Elles contiennent les données qui permettent de
définir un axe d’une étude.
- Ce type de tables joue le rôle de référentiel au
DATA WAREHOUSE.
• Les tables de faits
- Comme leur nom l’indique, Ces tables contiennent
uniquement les données factuelles du DATA
WAREHOUSE.
Free Powerpoint Templates
Page 29
30. Les aspects techniques du DW
• Les tables d'agrégats
- Ces tables sont spéciales, elles permettent
de simplifier le travail de restitution des
logiciels d’analyse;
- Elles contiennent des données à un niveau
de granularité plus grand que dans les
tables de faits;
Free Powerpoint Templates
Page 30
31. Les aspects techniques du DW
3. Les types de modèle
Modèle en étoile Modèle
Free Powerpoint Templates en flocon
Page 31
32. Modèle en étoile
• Une table de fait centrale et des dimensions
• Les dimensions n’ont pas de liaison entre elles
• Avantages
– Facilité de navigation
– Nombre de jointures limité
• Inconvénients
– Redondance dans les dimensions
– Toutes les dimensions ne concernent pas les
mesures
Free Powerpoint Templates
Page 32
33. Modèle en étoile
Dimension Temps
ID temps
année
mois
Dimension produit
jour
ID produit
Dimension Magasin …
ID magasin nom
description code
ville Table de faits Achat prix
surface ID client poids
ID temps groupe
… ID magasin famille
ID région …
ID produit
Dimension Region Quantité achetée Dimension Client
ID région Montant des achats ID client
pays nom
description prénom
district vente adresse
…. Free Powerpoint Templates …
Page 33
34. Modèle en flocon
• Une table de fait et des dimensions décomposées en
sous hiérarchies.
• On a un seul niveau hiérarchique dans une table de
dimension.
• La table de dimension de niveau hiérarchique le plus bas
est reliée à la table de fait. On dit qu’elle a la granularité
la plus fine.
• Avantages
– Normalisation des dimensions
– Économie d’espace disque
• Inconvénients
– Modèle plus complexe (jointure)
– Requêtes moins performantes
Free Powerpoint Templates
Page 34
35. Dimension produit
ID produit
Dimension Temps ID groupe
ID temps nom
annee code
mois prix
Dimension Magasin jour Dimension groupe
poids
ID magasin … ID groupe
…
description ID famille
ville Table de faits Achat
nom
surface ID client
ID temps …
…
ID magasin
Dimension Region ID région
ID région Dimension Famille
ID produit
ID division vente ID famille
Quantité achetée
pays Montant des achats nom
description …
…. Dimension Client
Dimension
ID client
Division vente
nom
ID division vente
prénom
description Free Powerpoint Templates
adresse
…. Page 35
…
37. SGBD et DW
Service Service Service
OLTP: On-Line commercial Financier livraison
Transactional BD prod BD prod BD prod
Processing
Clientèle
H
I
Data Warehouse S
T
OLAP: On-Line O
Analitical R
Clientèle I
Processing
Q
U
Free Powerpoint Templates E
Page 37
38. SGBD et DW
OLTP DW
Orienté transaction Orienté analyse
Orienté application Orienté sujet
Données courantes Données historisées
Données détaillées Données agrégées
Données évolutives Données statiques
Utilisateurs nombreux, Utilisateurs peu nombreux,
administrateurs/opérationnels manager
Temps d’exécution: court Temps d’exécution: long
Free Powerpoint Templates
Page 38
41. Conclusion
• L’utilisation des DATAWAREHOUSE est
aujourd’hui très demandé dans le monde
de l’entreprise, demande qui répond au
besoin toujours plus présent des
utilisateurs d’avoir les bonnes informations
au bon moment.
Free Powerpoint Templates
Page 41