2. Plan
Problématique des données dans un système
décisionnel
Architecture fonctionnelle d’un
système décisionnel
DATA WAREHOUSE – Les
entrepôts de donneés
3. Motivation
Je ne peux pas trouver la donnée que
je veux: beaucoup de versions
Je ne peux pas avoir la donnée que je
cherche: besoin d’expert
Je n’arrive pas à comprendre la
donnée: donnée non documentée
Je ne peux pas utiliser la donnée que
j’ai trouvé: résultat inattendue
4. Situation
Informations importantes
cachée
Informations historiques
Informations inconscientes
Informations limitées
Données globalisées
Ordres des actions perdus
Ambiguïté
Redémarrer la recherche
5. Problématique
Les décideurs d'une entreprise doivent pouvoir répondre à un
certain nombre de question pour diriger leur entreprise:
Qui sont mes clients ?
Pourquoi sont ils mes clients ?
Comment cibler ma clientèle ?
Quel est l'évolution de tel produit ?
Qui sont mes employés ?
L'objectif est donc d'apporter aux décideurs d'une entreprise les
moyens de répondre à ces questions.
6. Structures de Stockage de Données dans un Système
Décisionnel
Data Marts
(Magasins de données)
Data Warehouse
(Entrepôt de données)
ODS
(Operational Data Store)
Systèmes
Opérationnels
Data Mining
(Extraction de données)
Extraction
Alimentation
Transformation
Synthèse
Ensemble d’outils, méthodes et technologies
d’analyse mises en œuvre pour définir des
tendances, pour segmenter l’information ou pour
établir des corrélations entre les données
Magasin de données orienté sujet, non
volatile, mis à la disposition des utilisateurs
dans un contexte décisionnel décentralisé,
ciblé pour un usage particulier
Entrepôt de données spécifique au monde
décisionnel, destiné principalement à
analyser les leviers business potentiels
ODS: Operational Data Store
o Collection de données orientées sujet,
volatiles, organisées pour le support d’un
processus de décision ponctuel, en support à
une activité opérationnelle particulière
o Donne la vision immédiate et intégrée de
l’état d’un ou plusieurs systèmes opérants
7. Entrepôt de données spécifique au monde décisionnel
Collection de données orientées sujet
Contenu adapté aux besoins des décideurs
Structure multidimensionnelle spéciale
Niveau de détail bien étudié
Données historiques
Définition
8. Caractéristiques
Orienté sujet
Intégré
Orienté temps
Non volatile
L'entrepôt de données contient des données provenant de différentes
sources internes et externes. L'important est la qualité des données, à
savoir l'exactitude et la cohérence.
L'organisation des données est guidé par le point de vue des décideurs
sur des domaines spécifiques de l'entreprise
Les données dans un entrepôt de données a une dimension de temps, à
savoir toutes les valeurs de données et leurs changements dans le temps
peuvent être comparées et analysées long de l'axe de temps.
Contrairement aux bases de données opérationnelles, les données sont
stockées persistantes dans un entrepôt de données. L'accès est par la
lecture des données; analyse ne modifie pas les données.
14. Composants du Data Warehouse
Le système source : le système d'opération d'enregistrement, dont la fonction
consiste à capturer les transactions liées à l'activité.
Zone de préparation des données : des processus prépare les données
sources en vue de leur intégration puis de leur exploitation au sein du DW. Elle
ne doit offrir ni service des requêtes, ni service de présentation.
Serveur de présentation : machine cible sur laquelle l'entrepôt de données est
stocké et organisé pour répondre en accès direct aux requêtes émises par des
utilisateurs.
Data Mart : sous-ensemble logique d'un DW, destiné à quelques utilisateurs
d'un département.
Entrepôt de données : C'est tout simplement l'union des Data Marts qui le
composent. Il est alimenté par la zone de préparation des données.
L'administrateur de l'entrepôt de données est également responsable de la zone
de préparation des données.
Composants du Data Warehouse
OLAP (On Line Analytic Processing) : Activité globale de requêtage et de
présentation de données textuelles et numériques contenues dans l'entrepôt
de données ; style d'interrogation et de présentation spécifiquement
dimensionnel.
ROLAP (Relational OLAP) : ensemble d'interface utilisateur et d'applications
donnant une vision dimensionnelle des bases de données relationnelles.
MOLAP (Multidimensional OLAP) : ensemble d'interface utilisateur et
d'applications dont l'aspect dimensionnel est prépondérant.
Application utilisateur : ensemble d'outils qui présente des informations
répondant à un besoin spécifique sous forme graphique.
Outil d'accès aux données : client de l'entrepôt de données.
Outil de requête : types spécifique d'outil d'accès aux données qui invite
l'utilisateur à formuler ses propres requêtes en manipulant directement les
tables et leurs jointures.
Application de modélisation : type de client de base de données
sophistiqués doté de fonctionnalités analytiques qui transforment ou mettent
en forme les résultats obtenus.
Métadonnées : toutes informations de l'environnement du Data Warehouse
qui ne constituent pas les données proprement dites.
15. Composants communs du Data Warehouse
❑ Zone de transit: référentiel de préparation où les données de transaction
peuvent être transformées pour une utilisation dans l'entrepôt de données,
❑ Data Mart: jeu traditionnel modélisé de façon dimensionnelle de tables de
dimension
• Un entrepôt de données est l'union d'un ensemble de data marts
• Data mart indépendant: conçu pour une unité d'affaires stratégique ou d'un
département
❑ Operational Data Store (ODS)
17. Vs
Hadoop est capable de traiter de très grands volumes de données semi
structurées (fichiers logs, données événementielles…) ou non
structurées (analyse de sentiments basée sur les média sociaux tels que
tweets, blogs ou forums), en s’appuyant sur des jobs MapReduce.
Il ne s’agit pas d’un outil ETL mais plutôt d’une solution capable d’exécuter
des processus ETL en parallèle.
Hadoop ne peut donc être confortablement utilisé comme source
de données d’outils décisionnels pour effectuer des analyses ad-hoc
interactives
Toutefois, une solution décisionnelle telle qu’un data
warehouse demeure encore aujourd’hui la meilleure solution
pour permettre une analyse interactive et performante des
données structurées (qui peuvent être issues des calculs
d’un cluster Hadoop) via des outils décisionnels adaptés tels
que PowerPivot ou PowerView.
18. Pourquoi les entreprises ont déployé les data warehouse?
Dans une entreprise, le système d'information constitue
trop souvent une « boîte noire »,
Une entreprise a beaucoup de données, et alors?
Le Data warehouse permet
le pilotage de l ’entreprise et de ses processus.
La fédération des données souvent éparpillées dans différentes
bases de données
Une vision globale et orientée métiers de toutes les données que
manipule l ’entreprise
Faire face aux changements du marché et de l ’entreprise
Offre une information compréhensible, utile et rapide.
19. Ce Qu’il Faut Retenir
Le data Warehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées (orienté-temps) organisées pour la
prise de décision.
Dans une entreprise, il existe un seul entrepôt de données mais plusieurs
magasins de données : Finance, Vente…
Hadoop et Big Data ne peuvent pas être des sources de données pour les
systèmes décisionnels
22. Architecture
1) Les Bases de Données
• Bases de production de l’entreprise
• Bases créées par les utilisateurs
• Bases de données externes à l’entreprise
23. 2) Opérations sur les données
EXTRACTION
extraire que les données nécessaires de leurs environnement
d’origine .
TRANSFORMATION
structure ou valeur différente d’une même donnée •
redondances :un même client peut apparaître avec différents attributs
et propriétés selon la source consultée.
Il faut donc épurer et transformer les données.
CHARGEMENT/RAFRAICHISSEMENT
Opérations de calcul et d’agrégation.
Remplacement des certaines bases
procédures de chargement (nocturnes) et de restauration (en cas de
problème).
24. Architecture
3) Les outils
Extract d’ETI, Genio de Leonard ’s Logic, … •
Le développement d’outils spécifiques est envisageable mais risque
d’alourdir les tâches.
4) Dictionnaire de données
les méta-données : l’ensemble des informations qui permettent de qualifier
une donnée ; sa provenance, sa qualité, l’état de la base à cet instant
25. Architecture
5) Les Data-Marts
un DW focalisé sur un sujet particulier.
un mini DW lié à un métier particulier de l ’entreprise (finance,
commercial, …). •
Un DW est souvent volumineux avec des performances
inappropriées .
comporte moins de 50 Go, ce qui permet des performances
acceptables. •
La création d’un data-mart peut être un moyen de débuter un
projet de DW (projet pilote).
26. Architecture
6) Les bases multidimensionnelles et les outils OLAP
Les modèles de données
Modèles d’intégration :unifie les données opérationnelles.
Modèles de diffusion :représente le modèle conceptuel des données. Il
correspond aux bases multidimensionnelles (serveur OLAP). •
Modèles de présentation :est un complément au modèle conceptuel. C’est
à travers ce modèle que l’utilisateur voit les données (les outils clients
OLAP )
27. Architecture
7) Les outils OLAP (On-Line Analytical Processing)
ensemble des outils multidimensionnels nécessaires à l’accès.
8) Les outils multidimensionnels MOLAP
l'application physique du concept OLAP
rapides et performantes.
fonctionnalités particulièrement évoluées.
restent limitées au gigaoctet
28. Les aspects techniques de DataWarehouse
Modélisation
Les tables de dimensions
Elles contiennent les données qui permettent de définir un axe d’une
étude.
Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE
Les tables de faits
Comme leur nom l’indique, Ces tables contiennent uniquement les
données factuelles du DATA WAREHOUSE
29. Les aspects techniques de DataWarehouse
Les types de modèle
Une table de fait centrale et des dimensions
Les dimensions n’ont pas de liaison entre elles.
Avantages
Facilité de navigation
Nombre de jointures limité
Inconvénients
Redondance dans les dimensions
30. Les aspects techniques de DataWarehouse
Les types de modèle
Une table de fait et des dimensions décomposées en
sous hiérarchies.
On a un seul niveau hiérarchique dans une table de
dimension.
La table de dimension de niveau hiérarchique le plus bas
est reliée à la table de fait
Avantages
Normalisation des dimensions –
Économie d’espace disque•
Inconvénients
Modèle plus complexe (jointure)
Requêtes moins performantes
31. ORACLE
Oracle (Oracle Corporation) est une entreprise américaine créée
en 1977 par Larry Ellison. Ses produits phares sont Oracle
Database (un système de gestion de base de données), Oracle
Weblogic Server (un serveur d'applications) et Oracle E-Business
Suite (un progiciel de gestion intégré).
32. Que représente le terme BI pour ORACLE
l'ensemble des processus mis en œuvre pour acquérir et gérer
l'ensemble des informations de l'entreprise.
Une solution Oracle BI doit valoriser les données traitées dans
l'entreprise.
L'environnement Oracle Business Intelligence s'appuie sur les
technologies OLAP (OnLine Analytical Processing), la fouille
de données ou data mining, et les entrepôts pour satisfaire
aux critères BI.
33. Oracle warehouse
C’est une intégration de données, entrepôts de données,
qualité des données, et solution de gestion de métadonnées
conçue pour la base de données Oracle.
OWB(Warehouse Builder) est complètement intégré avec
l'installation de la base de données Oracle depuis la version
11g Release 1.
34. Qui sont les acteurs du monde OracleBl ?
L'architecte BI (Data Warehouse Analyst)
définir les structures des bases de données, métadonnées, les
opérations ET L vers l'entrepôt (data warehouse) ou le data-mart. .
Le logiciel OracleBl Warehouse Builder permet de réaliser
l'implantation l'entrepôt.
L'administrateur BI
superviseur de la construction de DW et/ou des data-mart.
responsable de l'alimentation des données de DW.
Organisateur des données au sein du référentiel afin de faciliter les
requêtes émises par les analystes ou les développeurs.
35. Qui sont les acteurs du monde OracleBl ?
Les utilisateurs BI de l'entreprise
créent des rapports pour mieux cerner l'activité de l'entreprise et
pouvoir répondre à des questions telles que :
-Quels sont les magasins qui réalisent le meilleur chiffre d'affaires ?
Quels sont les meilleurs produits vendus par semaine, par magasin...?
- Quelle est l'évolution du chiffre d'affaires entre l'année n-l
et l'année n ?
-Quelle est la moyenne mobile des ventes des trois derniers mois ?
36. Qui sont les acteurs du monde OracleBl ?
Les utilisateurs BI de l'entreprise
Pour faciliter l'interrogation des données, Oracle met à la disposition
des utilisateurs de BI les composants suivants :
OracleBl Spreadsheet Add-ln ,
- OracleBl Discoverer.
38. Conclusion
L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans
le monde de l’entreprise, demande qui répond au besoin toujours plus
présent des utilisateurs d’avoir les bonnes informations au bon
moment.
Présenter ma soutenance tournée autour de mon mémoire ayant pour sujet : la démarche d’amélioration continue au sein d’une SSII
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle
Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse
9000 collaborateurs
30 qualiticiens : 3 / 1000 (autres : 100 / 1000)
Organisation matricielle