Emna borgi mabroukachraita-datawarehouse

E
Emna borgi mabroukachraita-datawarehouse
Plan
Problématique des données dans un système
décisionnel
Architecture fonctionnelle d’un
système décisionnel
DATA WAREHOUSE – Les
entrepôts de donneés
Motivation
 Je ne peux pas trouver la donnée que
je veux: beaucoup de versions
 Je ne peux pas avoir la donnée que je
cherche: besoin d’expert
 Je n’arrive pas à comprendre la
donnée: donnée non documentée
 Je ne peux pas utiliser la donnée que
j’ai trouvé: résultat inattendue
Situation
 Informations importantes
cachée
 Informations historiques
 Informations inconscientes
 Informations limitées
Données globalisées
Ordres des actions perdus
Ambiguïté
Redémarrer la recherche
Problématique
Les décideurs d'une entreprise doivent pouvoir répondre à un
certain nombre de question pour diriger leur entreprise:
 Qui sont mes clients ?
 Pourquoi sont ils mes clients ?
 Comment cibler ma clientèle ?
 Quel est l'évolution de tel produit ?
 Qui sont mes employés ?
L'objectif est donc d'apporter aux décideurs d'une entreprise les
moyens de répondre à ces questions.
Structures de Stockage de Données dans un Système
Décisionnel
Data Marts
(Magasins de données)
Data Warehouse
(Entrepôt de données)
ODS
(Operational Data Store)
Systèmes
Opérationnels
Data Mining
(Extraction de données)
Extraction
Alimentation
Transformation
Synthèse
Ensemble d’outils, méthodes et technologies
d’analyse mises en œuvre pour définir des
tendances, pour segmenter l’information ou pour
établir des corrélations entre les données
Magasin de données orienté sujet, non
volatile, mis à la disposition des utilisateurs
dans un contexte décisionnel décentralisé,
ciblé pour un usage particulier
Entrepôt de données spécifique au monde
décisionnel, destiné principalement à
analyser les leviers business potentiels
ODS: Operational Data Store
o Collection de données orientées sujet,
volatiles, organisées pour le support d’un
processus de décision ponctuel, en support à
une activité opérationnelle particulière
o Donne la vision immédiate et intégrée de
l’état d’un ou plusieurs systèmes opérants
 Entrepôt de données spécifique au monde décisionnel
 Collection de données orientées sujet
 Contenu adapté aux besoins des décideurs
 Structure multidimensionnelle spéciale
 Niveau de détail bien étudié
 Données historiques
Définition
Caractéristiques
 Orienté sujet
 Intégré
 Orienté temps
 Non volatile
L'entrepôt de données contient des données provenant de différentes
sources internes et externes. L'important est la qualité des données, à
savoir l'exactitude et la cohérence.
L'organisation des données est guidé par le point de vue des décideurs
sur des domaines spécifiques de l'entreprise
Les données dans un entrepôt de données a une dimension de temps, à
savoir toutes les valeurs de données et leurs changements dans le temps
peuvent être comparées et analysées long de l'axe de temps.
Contrairement aux bases de données opérationnelles, les données sont
stockées persistantes dans un entrepôt de données. L'accès est par la
lecture des données; analyse ne modifie pas les données.
Améliorant ces caractéristiques par des exemples
Orienté sujet
Systèmes
opérationnels
Systèmes BI
Shopping
Production
Ventes
Clients
Temps
Produits
Intégré
Systèmes
opérationnels
Systèmes BI
H,F
0,1
Homme,Femme
Homme,Femme
Orienté temps
Systèmes
opérationnels
Systèmes BI
Shopping Clients
(60-90 jours) (5-10 ans)
Non volatile
Systèmes
opérationnels
Systèmes BI
Shopping Clients
supprimer
insérer
modifier accès charger
Composants du Data Warehouse
 Le système source : le système d'opération d'enregistrement, dont la fonction
consiste à capturer les transactions liées à l'activité.
 Zone de préparation des données : des processus prépare les données
sources en vue de leur intégration puis de leur exploitation au sein du DW. Elle
ne doit offrir ni service des requêtes, ni service de présentation.
 Serveur de présentation : machine cible sur laquelle l'entrepôt de données est
stocké et organisé pour répondre en accès direct aux requêtes émises par des
utilisateurs.
 Data Mart : sous-ensemble logique d'un DW, destiné à quelques utilisateurs
d'un département.
 Entrepôt de données : C'est tout simplement l'union des Data Marts qui le
composent. Il est alimenté par la zone de préparation des données.
L'administrateur de l'entrepôt de données est également responsable de la zone
de préparation des données.
Composants du Data Warehouse
 OLAP (On Line Analytic Processing) : Activité globale de requêtage et de
présentation de données textuelles et numériques contenues dans l'entrepôt
de données ; style d'interrogation et de présentation spécifiquement
dimensionnel.
 ROLAP (Relational OLAP) : ensemble d'interface utilisateur et d'applications
donnant une vision dimensionnelle des bases de données relationnelles.
 MOLAP (Multidimensional OLAP) : ensemble d'interface utilisateur et
d'applications dont l'aspect dimensionnel est prépondérant.
 Application utilisateur : ensemble d'outils qui présente des informations
répondant à un besoin spécifique sous forme graphique.
 Outil d'accès aux données : client de l'entrepôt de données.
 Outil de requête : types spécifique d'outil d'accès aux données qui invite
l'utilisateur à formuler ses propres requêtes en manipulant directement les
tables et leurs jointures.
 Application de modélisation : type de client de base de données
sophistiqués doté de fonctionnalités analytiques qui transforment ou mettent
en forme les résultats obtenus.
 Métadonnées : toutes informations de l'environnement du Data Warehouse
qui ne constituent pas les données proprement dites.
Composants communs du Data Warehouse
❑ Zone de transit: référentiel de préparation où les données de transaction
peuvent être transformées pour une utilisation dans l'entrepôt de données,
❑ Data Mart: jeu traditionnel modélisé de façon dimensionnelle de tables de
dimension
• Un entrepôt de données est l'union d'un ensemble de data marts
• Data mart indépendant: conçu pour une unité d'affaires stratégique ou d'un
département
❑ Operational Data Store (ODS)
Emna borgi mabroukachraita-datawarehouse
Vs
Hadoop est capable de traiter de très grands volumes de données semi
structurées (fichiers logs, données événementielles…) ou non
structurées (analyse de sentiments basée sur les média sociaux tels que
tweets, blogs ou forums), en s’appuyant sur des jobs MapReduce.
Il ne s’agit pas d’un outil ETL mais plutôt d’une solution capable d’exécuter
des processus ETL en parallèle.
Hadoop ne peut donc être confortablement utilisé comme source
de données d’outils décisionnels pour effectuer des analyses ad-hoc
interactives
Toutefois, une solution décisionnelle telle qu’un data
warehouse demeure encore aujourd’hui la meilleure solution
pour permettre une analyse interactive et performante des
données structurées (qui peuvent être issues des calculs
d’un cluster Hadoop) via des outils décisionnels adaptés tels
que PowerPivot ou PowerView.
Pourquoi les entreprises ont déployé les data warehouse?
 Dans une entreprise, le système d'information constitue
trop souvent une « boîte noire »,
Une entreprise a beaucoup de données, et alors?
Le Data warehouse permet
 le pilotage de l ’entreprise et de ses processus.
 La fédération des données souvent éparpillées dans différentes
bases de données
 Une vision globale et orientée métiers de toutes les données que
manipule l ’entreprise
 Faire face aux changements du marché et de l ’entreprise
 Offre une information compréhensible, utile et rapide.
Ce Qu’il Faut Retenir
 Le data Warehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées (orienté-temps) organisées pour la
prise de décision.
 Dans une entreprise, il existe un seul entrepôt de données mais plusieurs
magasins de données : Finance, Vente…
 Hadoop et Big Data ne peuvent pas être des sources de données pour les
systèmes décisionnels
Architecture
Architecture
Architecture
1) Les Bases de Données
• Bases de production de l’entreprise
• Bases créées par les utilisateurs
• Bases de données externes à l’entreprise
2) Opérations sur les données
EXTRACTION
extraire que les données nécessaires de leurs environnement
d’origine .
TRANSFORMATION
structure ou valeur différente d’une même donnée •
redondances :un même client peut apparaître avec différents attributs
et propriétés selon la source consultée.
Il faut donc épurer et transformer les données.
CHARGEMENT/RAFRAICHISSEMENT
Opérations de calcul et d’agrégation.
Remplacement des certaines bases
procédures de chargement (nocturnes) et de restauration (en cas de
problème).
Architecture
3) Les outils
Extract d’ETI, Genio de Leonard ’s Logic, … •
Le développement d’outils spécifiques est envisageable mais risque
d’alourdir les tâches.
4) Dictionnaire de données
les méta-données : l’ensemble des informations qui permettent de qualifier
une donnée ; sa provenance, sa qualité, l’état de la base à cet instant
Architecture
5) Les Data-Marts
un DW focalisé sur un sujet particulier.
un mini DW lié à un métier particulier de l ’entreprise (finance,
commercial, …). •
Un DW est souvent volumineux avec des performances
inappropriées .
comporte moins de 50 Go, ce qui permet des performances
acceptables. •
La création d’un data-mart peut être un moyen de débuter un
projet de DW (projet pilote).
Architecture
6) Les bases multidimensionnelles et les outils OLAP
Les modèles de données
Modèles d’intégration :unifie les données opérationnelles.
Modèles de diffusion :représente le modèle conceptuel des données. Il
correspond aux bases multidimensionnelles (serveur OLAP). •
Modèles de présentation :est un complément au modèle conceptuel. C’est
à travers ce modèle que l’utilisateur voit les données (les outils clients
OLAP )
Architecture
7) Les outils OLAP (On-Line Analytical Processing)
ensemble des outils multidimensionnels nécessaires à l’accès.
8) Les outils multidimensionnels MOLAP
 l'application physique du concept OLAP
 rapides et performantes.
 fonctionnalités particulièrement évoluées.
 restent limitées au gigaoctet
Les aspects techniques de DataWarehouse
Modélisation
Les tables de dimensions
Elles contiennent les données qui permettent de définir un axe d’une
étude.
Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE
Les tables de faits
Comme leur nom l’indique, Ces tables contiennent uniquement les
données factuelles du DATA WAREHOUSE
Les aspects techniques de DataWarehouse
Les types de modèle
Une table de fait centrale et des dimensions
Les dimensions n’ont pas de liaison entre elles.
Avantages
Facilité de navigation
Nombre de jointures limité
Inconvénients
Redondance dans les dimensions
Les aspects techniques de DataWarehouse
Les types de modèle
Une table de fait et des dimensions décomposées en
sous hiérarchies.
On a un seul niveau hiérarchique dans une table de
dimension.
La table de dimension de niveau hiérarchique le plus bas
est reliée à la table de fait
Avantages
Normalisation des dimensions –
Économie d’espace disque•
Inconvénients
Modèle plus complexe (jointure)
Requêtes moins performantes
ORACLE
Oracle (Oracle Corporation) est une entreprise américaine créée
en 1977 par Larry Ellison. Ses produits phares sont Oracle
Database (un système de gestion de base de données), Oracle
Weblogic Server (un serveur d'applications) et Oracle E-Business
Suite (un progiciel de gestion intégré).
Que représente le terme BI pour ORACLE
 l'ensemble des processus mis en œuvre pour acquérir et gérer
l'ensemble des informations de l'entreprise.
 Une solution Oracle BI doit valoriser les données traitées dans
l'entreprise.
 L'environnement Oracle Business Intelligence s'appuie sur les
technologies OLAP (OnLine Analytical Processing), la fouille
de données ou data mining, et les entrepôts pour satisfaire
aux critères BI.
Oracle warehouse
 C’est une intégration de données, entrepôts de données,
qualité des données, et solution de gestion de métadonnées
conçue pour la base de données Oracle.
 OWB(Warehouse Builder) est complètement intégré avec
l'installation de la base de données Oracle depuis la version
11g Release 1.
Qui sont les acteurs du monde OracleBl ?
L'architecte BI (Data Warehouse Analyst)
définir les structures des bases de données, métadonnées, les
opérations ET L vers l'entrepôt (data warehouse) ou le data-mart. .
Le logiciel OracleBl Warehouse Builder permet de réaliser
l'implantation l'entrepôt.
L'administrateur BI
 superviseur de la construction de DW et/ou des data-mart.
 responsable de l'alimentation des données de DW.
 Organisateur des données au sein du référentiel afin de faciliter les
requêtes émises par les analystes ou les développeurs.
Qui sont les acteurs du monde OracleBl ?
Les utilisateurs BI de l'entreprise
créent des rapports pour mieux cerner l'activité de l'entreprise et
pouvoir répondre à des questions telles que :
-Quels sont les magasins qui réalisent le meilleur chiffre d'affaires ?
Quels sont les meilleurs produits vendus par semaine, par magasin...?
- Quelle est l'évolution du chiffre d'affaires entre l'année n-l
et l'année n ?
-Quelle est la moyenne mobile des ventes des trois derniers mois ?
Qui sont les acteurs du monde OracleBl ?
Les utilisateurs BI de l'entreprise
Pour faciliter l'interrogation des données, Oracle met à la disposition
des utilisateurs de BI les composants suivants :
OracleBl Spreadsheet Add-ln ,
- OracleBl Discoverer.
Le marché du BI
Conclusion
L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans
le monde de l’entreprise, demande qui répond au besoin toujours plus
présent des utilisateurs d’avoir les bonnes informations au bon
moment.
Merci pour votre attention !
1 von 39

Recomendados

Qu'est-ce qu'un ETL ? von
Qu'est-ce qu'un ETL ?Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?Mathieu Lahaye
5.2K views11 Folien
Business Intelligence : introduction to datawarehouse von
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
7.3K views63 Folien
Data warehouse von
Data warehouseData warehouse
Data warehouseDimassi Khoulouda
15.8K views44 Folien
Chp2 - Les Entrepôts de Données von
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
20K views33 Folien
Microsoft Power Business Intelligence von
Microsoft Power Business IntelligenceMicrosoft Power Business Intelligence
Microsoft Power Business IntelligenceMario-Charly TOBOSSOU
838 views6 Folien
Conception datawarehouse von
Conception datawarehouseConception datawarehouse
Conception datawarehouseHassane Dkhissi
10.2K views16 Folien

Más contenido relacionado

Was ist angesagt?

Informatique Décisionnelle décisionnelle von
Informatique Décisionnelle décisionnelleInformatique Décisionnelle décisionnelle
Informatique Décisionnelle décisionnelleHajer Trabelsi
2.2K views30 Folien
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essai von
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiSSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiMicrosoft Technet France
5.5K views46 Folien
Business intelligence von
Business intelligenceBusiness intelligence
Business intelligenceAhmed Mesellem
2.3K views25 Folien
Dwh udl 2014_2015_v0.22 - student von
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - studentCarlos Sanin
59 views27 Folien
Projet Bi - 3 - Alimentation des données von
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
11.3K views24 Folien
Chp1 - Introduction à l'Informatique Décisionnelle von
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
44K views38 Folien

Was ist angesagt?(20)

Informatique Décisionnelle décisionnelle von Hajer Trabelsi
Informatique Décisionnelle décisionnelleInformatique Décisionnelle décisionnelle
Informatique Décisionnelle décisionnelle
Hajer Trabelsi2.2K views
Dwh udl 2014_2015_v0.22 - student von Carlos Sanin
Dwh udl 2014_2015_v0.22 - studentDwh udl 2014_2015_v0.22 - student
Dwh udl 2014_2015_v0.22 - student
Carlos Sanin59 views
Projet Bi - 3 - Alimentation des données von Jean-Marc Dupont
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
Jean-Marc Dupont11.3K views
Chp1 - Introduction à l'Informatique Décisionnelle von Lilia Sfaxi
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi44K views
Business Intelligence : Offres du marché et benchmarking von Samia NACIRI
Business Intelligence : Offres du marché et benchmarkingBusiness Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarking
Samia NACIRI1.6K views
DataWarehouse von nzuguem
DataWarehouseDataWarehouse
DataWarehouse
nzuguem1.8K views
Orsys - Contruire un Data Warehouse - Certificat von Régis Bernasconi
Orsys - Contruire un Data Warehouse - CertificatOrsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - Certificat
Régis Bernasconi238 views
Système Information - ETL et EAI - Décisionnel et Opérationnel von Frédéric FAURE
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
Frédéric FAURE21.2K views
De la business intelligence au Big Data von Technofutur TIC
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big Data
Technofutur TIC20.7K views
Projet BI - 2 - Conception base de données von Jean-Marc Dupont
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
Jean-Marc Dupont16.1K views
Windows 8, Server 2012 et office 2013 von Patricia NENZI
Windows 8, Server 2012 et office 2013Windows 8, Server 2012 et office 2013
Windows 8, Server 2012 et office 2013
Patricia NENZI1.3K views
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ... von Robert Bira
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...
Une nouvelle plateforme de donnée pour vos applications transactionnelles et ...
Robert Bira62 views

Similar a Emna borgi mabroukachraita-datawarehouse

Big data von
Big dataBig data
Big dataIbn Tofail University
179 views25 Folien
Etat de l’art approche et outils BI von
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BISaid Sadik
9.2K views98 Folien
Ecosystème Big Data von
Ecosystème Big DataEcosystème Big Data
Ecosystème Big DataIdriss22
6 views201 Folien
Livre Blanc : comprendre les data-lakes von
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesConverteo
12K views21 Folien
CHAP 1 PRÉSENTATION GENERALE.pdf von
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfamine17157
6 views69 Folien
Intro SQL von
Intro SQL Intro SQL
Intro SQL Zakaria M'Dini
1.8K views25 Folien

Similar a Emna borgi mabroukachraita-datawarehouse(20)

Etat de l’art approche et outils BI von Said Sadik
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
Said Sadik9.2K views
Ecosystème Big Data von Idriss22
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
Idriss226 views
Livre Blanc : comprendre les data-lakes von Converteo
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
Converteo12K views
CHAP 1 PRÉSENTATION GENERALE.pdf von amine17157
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdf
amine171576 views
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or... von Gautier Poupeau
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Gautier Poupeau4.4K views
Le m _tier_de_dba_797144552 von Algeria JUG
Le m _tier_de_dba_797144552Le m _tier_de_dba_797144552
Le m _tier_de_dba_797144552
Algeria JUG684 views
Data Warehousing.pptx von SamirAwad14
Data Warehousing.pptxData Warehousing.pptx
Data Warehousing.pptx
SamirAwad1419 views
Le métier d’administrateur de von Algeria JUG
Le métier d’administrateur deLe métier d’administrateur de
Le métier d’administrateur de
Algeria JUG810 views
Discovery Session France: Atelier découverte de la Data Virtualization von Denodo
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
Denodo 245 views
Découvrez le parcours de vos données : lignage de données de bout en bout ... von Wiiisdom
Découvrez le parcours de vos données : lignage de données de bout en bout ...Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...
Wiiisdom181 views
Morning Tech#1 BigData - Oxalide Academy von Oxalide
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
Oxalide266 views
Oxalide MorningTech #1 - BigData von Ludovic Piot
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
Ludovic Piot715 views
Réussissez vos projets d’analytique self-service avec une couche de services ... von Denodo
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...
Denodo 69 views
Bases de donnees fondamentaux von Rokhaya CISSE
Bases de donnees fondamentauxBases de donnees fondamentaux
Bases de donnees fondamentaux
Rokhaya CISSE173 views
Livre blanc data-lakes converteo 2018 von Converteo
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
Converteo3.8K views
Cours data warehouse von khlifi z
Cours data warehouseCours data warehouse
Cours data warehouse
khlifi z566 views

Emna borgi mabroukachraita-datawarehouse

  • 2. Plan Problématique des données dans un système décisionnel Architecture fonctionnelle d’un système décisionnel DATA WAREHOUSE – Les entrepôts de donneés
  • 3. Motivation  Je ne peux pas trouver la donnée que je veux: beaucoup de versions  Je ne peux pas avoir la donnée que je cherche: besoin d’expert  Je n’arrive pas à comprendre la donnée: donnée non documentée  Je ne peux pas utiliser la donnée que j’ai trouvé: résultat inattendue
  • 4. Situation  Informations importantes cachée  Informations historiques  Informations inconscientes  Informations limitées Données globalisées Ordres des actions perdus Ambiguïté Redémarrer la recherche
  • 5. Problématique Les décideurs d'une entreprise doivent pouvoir répondre à un certain nombre de question pour diriger leur entreprise:  Qui sont mes clients ?  Pourquoi sont ils mes clients ?  Comment cibler ma clientèle ?  Quel est l'évolution de tel produit ?  Qui sont mes employés ? L'objectif est donc d'apporter aux décideurs d'une entreprise les moyens de répondre à ces questions.
  • 6. Structures de Stockage de Données dans un Système Décisionnel Data Marts (Magasins de données) Data Warehouse (Entrepôt de données) ODS (Operational Data Store) Systèmes Opérationnels Data Mining (Extraction de données) Extraction Alimentation Transformation Synthèse Ensemble d’outils, méthodes et technologies d’analyse mises en œuvre pour définir des tendances, pour segmenter l’information ou pour établir des corrélations entre les données Magasin de données orienté sujet, non volatile, mis à la disposition des utilisateurs dans un contexte décisionnel décentralisé, ciblé pour un usage particulier Entrepôt de données spécifique au monde décisionnel, destiné principalement à analyser les leviers business potentiels ODS: Operational Data Store o Collection de données orientées sujet, volatiles, organisées pour le support d’un processus de décision ponctuel, en support à une activité opérationnelle particulière o Donne la vision immédiate et intégrée de l’état d’un ou plusieurs systèmes opérants
  • 7.  Entrepôt de données spécifique au monde décisionnel  Collection de données orientées sujet  Contenu adapté aux besoins des décideurs  Structure multidimensionnelle spéciale  Niveau de détail bien étudié  Données historiques Définition
  • 8. Caractéristiques  Orienté sujet  Intégré  Orienté temps  Non volatile L'entrepôt de données contient des données provenant de différentes sources internes et externes. L'important est la qualité des données, à savoir l'exactitude et la cohérence. L'organisation des données est guidé par le point de vue des décideurs sur des domaines spécifiques de l'entreprise Les données dans un entrepôt de données a une dimension de temps, à savoir toutes les valeurs de données et leurs changements dans le temps peuvent être comparées et analysées long de l'axe de temps. Contrairement aux bases de données opérationnelles, les données sont stockées persistantes dans un entrepôt de données. L'accès est par la lecture des données; analyse ne modifie pas les données.
  • 13. Non volatile Systèmes opérationnels Systèmes BI Shopping Clients supprimer insérer modifier accès charger
  • 14. Composants du Data Warehouse  Le système source : le système d'opération d'enregistrement, dont la fonction consiste à capturer les transactions liées à l'activité.  Zone de préparation des données : des processus prépare les données sources en vue de leur intégration puis de leur exploitation au sein du DW. Elle ne doit offrir ni service des requêtes, ni service de présentation.  Serveur de présentation : machine cible sur laquelle l'entrepôt de données est stocké et organisé pour répondre en accès direct aux requêtes émises par des utilisateurs.  Data Mart : sous-ensemble logique d'un DW, destiné à quelques utilisateurs d'un département.  Entrepôt de données : C'est tout simplement l'union des Data Marts qui le composent. Il est alimenté par la zone de préparation des données. L'administrateur de l'entrepôt de données est également responsable de la zone de préparation des données. Composants du Data Warehouse  OLAP (On Line Analytic Processing) : Activité globale de requêtage et de présentation de données textuelles et numériques contenues dans l'entrepôt de données ; style d'interrogation et de présentation spécifiquement dimensionnel.  ROLAP (Relational OLAP) : ensemble d'interface utilisateur et d'applications donnant une vision dimensionnelle des bases de données relationnelles.  MOLAP (Multidimensional OLAP) : ensemble d'interface utilisateur et d'applications dont l'aspect dimensionnel est prépondérant.  Application utilisateur : ensemble d'outils qui présente des informations répondant à un besoin spécifique sous forme graphique.  Outil d'accès aux données : client de l'entrepôt de données.  Outil de requête : types spécifique d'outil d'accès aux données qui invite l'utilisateur à formuler ses propres requêtes en manipulant directement les tables et leurs jointures.  Application de modélisation : type de client de base de données sophistiqués doté de fonctionnalités analytiques qui transforment ou mettent en forme les résultats obtenus.  Métadonnées : toutes informations de l'environnement du Data Warehouse qui ne constituent pas les données proprement dites.
  • 15. Composants communs du Data Warehouse ❑ Zone de transit: référentiel de préparation où les données de transaction peuvent être transformées pour une utilisation dans l'entrepôt de données, ❑ Data Mart: jeu traditionnel modélisé de façon dimensionnelle de tables de dimension • Un entrepôt de données est l'union d'un ensemble de data marts • Data mart indépendant: conçu pour une unité d'affaires stratégique ou d'un département ❑ Operational Data Store (ODS)
  • 17. Vs Hadoop est capable de traiter de très grands volumes de données semi structurées (fichiers logs, données événementielles…) ou non structurées (analyse de sentiments basée sur les média sociaux tels que tweets, blogs ou forums), en s’appuyant sur des jobs MapReduce. Il ne s’agit pas d’un outil ETL mais plutôt d’une solution capable d’exécuter des processus ETL en parallèle. Hadoop ne peut donc être confortablement utilisé comme source de données d’outils décisionnels pour effectuer des analyses ad-hoc interactives Toutefois, une solution décisionnelle telle qu’un data warehouse demeure encore aujourd’hui la meilleure solution pour permettre une analyse interactive et performante des données structurées (qui peuvent être issues des calculs d’un cluster Hadoop) via des outils décisionnels adaptés tels que PowerPivot ou PowerView.
  • 18. Pourquoi les entreprises ont déployé les data warehouse?  Dans une entreprise, le système d'information constitue trop souvent une « boîte noire », Une entreprise a beaucoup de données, et alors? Le Data warehouse permet  le pilotage de l ’entreprise et de ses processus.  La fédération des données souvent éparpillées dans différentes bases de données  Une vision globale et orientée métiers de toutes les données que manipule l ’entreprise  Faire face aux changements du marché et de l ’entreprise  Offre une information compréhensible, utile et rapide.
  • 19. Ce Qu’il Faut Retenir  Le data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées (orienté-temps) organisées pour la prise de décision.  Dans une entreprise, il existe un seul entrepôt de données mais plusieurs magasins de données : Finance, Vente…  Hadoop et Big Data ne peuvent pas être des sources de données pour les systèmes décisionnels
  • 22. Architecture 1) Les Bases de Données • Bases de production de l’entreprise • Bases créées par les utilisateurs • Bases de données externes à l’entreprise
  • 23. 2) Opérations sur les données EXTRACTION extraire que les données nécessaires de leurs environnement d’origine . TRANSFORMATION structure ou valeur différente d’une même donnée • redondances :un même client peut apparaître avec différents attributs et propriétés selon la source consultée. Il faut donc épurer et transformer les données. CHARGEMENT/RAFRAICHISSEMENT Opérations de calcul et d’agrégation. Remplacement des certaines bases procédures de chargement (nocturnes) et de restauration (en cas de problème).
  • 24. Architecture 3) Les outils Extract d’ETI, Genio de Leonard ’s Logic, … • Le développement d’outils spécifiques est envisageable mais risque d’alourdir les tâches. 4) Dictionnaire de données les méta-données : l’ensemble des informations qui permettent de qualifier une donnée ; sa provenance, sa qualité, l’état de la base à cet instant
  • 25. Architecture 5) Les Data-Marts un DW focalisé sur un sujet particulier. un mini DW lié à un métier particulier de l ’entreprise (finance, commercial, …). • Un DW est souvent volumineux avec des performances inappropriées . comporte moins de 50 Go, ce qui permet des performances acceptables. • La création d’un data-mart peut être un moyen de débuter un projet de DW (projet pilote).
  • 26. Architecture 6) Les bases multidimensionnelles et les outils OLAP Les modèles de données Modèles d’intégration :unifie les données opérationnelles. Modèles de diffusion :représente le modèle conceptuel des données. Il correspond aux bases multidimensionnelles (serveur OLAP). • Modèles de présentation :est un complément au modèle conceptuel. C’est à travers ce modèle que l’utilisateur voit les données (les outils clients OLAP )
  • 27. Architecture 7) Les outils OLAP (On-Line Analytical Processing) ensemble des outils multidimensionnels nécessaires à l’accès. 8) Les outils multidimensionnels MOLAP  l'application physique du concept OLAP  rapides et performantes.  fonctionnalités particulièrement évoluées.  restent limitées au gigaoctet
  • 28. Les aspects techniques de DataWarehouse Modélisation Les tables de dimensions Elles contiennent les données qui permettent de définir un axe d’une étude. Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE Les tables de faits Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE
  • 29. Les aspects techniques de DataWarehouse Les types de modèle Une table de fait centrale et des dimensions Les dimensions n’ont pas de liaison entre elles. Avantages Facilité de navigation Nombre de jointures limité Inconvénients Redondance dans les dimensions
  • 30. Les aspects techniques de DataWarehouse Les types de modèle Une table de fait et des dimensions décomposées en sous hiérarchies. On a un seul niveau hiérarchique dans une table de dimension. La table de dimension de niveau hiérarchique le plus bas est reliée à la table de fait Avantages Normalisation des dimensions – Économie d’espace disque• Inconvénients Modèle plus complexe (jointure) Requêtes moins performantes
  • 31. ORACLE Oracle (Oracle Corporation) est une entreprise américaine créée en 1977 par Larry Ellison. Ses produits phares sont Oracle Database (un système de gestion de base de données), Oracle Weblogic Server (un serveur d'applications) et Oracle E-Business Suite (un progiciel de gestion intégré).
  • 32. Que représente le terme BI pour ORACLE  l'ensemble des processus mis en œuvre pour acquérir et gérer l'ensemble des informations de l'entreprise.  Une solution Oracle BI doit valoriser les données traitées dans l'entreprise.  L'environnement Oracle Business Intelligence s'appuie sur les technologies OLAP (OnLine Analytical Processing), la fouille de données ou data mining, et les entrepôts pour satisfaire aux critères BI.
  • 33. Oracle warehouse  C’est une intégration de données, entrepôts de données, qualité des données, et solution de gestion de métadonnées conçue pour la base de données Oracle.  OWB(Warehouse Builder) est complètement intégré avec l'installation de la base de données Oracle depuis la version 11g Release 1.
  • 34. Qui sont les acteurs du monde OracleBl ? L'architecte BI (Data Warehouse Analyst) définir les structures des bases de données, métadonnées, les opérations ET L vers l'entrepôt (data warehouse) ou le data-mart. . Le logiciel OracleBl Warehouse Builder permet de réaliser l'implantation l'entrepôt. L'administrateur BI  superviseur de la construction de DW et/ou des data-mart.  responsable de l'alimentation des données de DW.  Organisateur des données au sein du référentiel afin de faciliter les requêtes émises par les analystes ou les développeurs.
  • 35. Qui sont les acteurs du monde OracleBl ? Les utilisateurs BI de l'entreprise créent des rapports pour mieux cerner l'activité de l'entreprise et pouvoir répondre à des questions telles que : -Quels sont les magasins qui réalisent le meilleur chiffre d'affaires ? Quels sont les meilleurs produits vendus par semaine, par magasin...? - Quelle est l'évolution du chiffre d'affaires entre l'année n-l et l'année n ? -Quelle est la moyenne mobile des ventes des trois derniers mois ?
  • 36. Qui sont les acteurs du monde OracleBl ? Les utilisateurs BI de l'entreprise Pour faciliter l'interrogation des données, Oracle met à la disposition des utilisateurs de BI les composants suivants : OracleBl Spreadsheet Add-ln , - OracleBl Discoverer.
  • 38. Conclusion L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans le monde de l’entreprise, demande qui répond au besoin toujours plus présent des utilisateurs d’avoir les bonnes informations au bon moment.
  • 39. Merci pour votre attention !

Hinweis der Redaktion

  1. Présenter ma soutenance tournée autour de mon mémoire ayant pour sujet : la démarche d’amélioration continue au sein d’une SSII
  2. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  3. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  4. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  5. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  6. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  7. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  8. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  9. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  10. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  11. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  12. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  13. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  14. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  15. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  16. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  17. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle
  18. Mes réflexions et démonstrations sont articulés notamment autour d’une SSII côtée en bourse 9000 collaborateurs 30 qualiticiens : 3 / 1000 (autres : 100 / 1000) Organisation matricielle