3. Rôle des interfaces (ETL)
3
Sont capables d’accéder à des sources
multiples
o BD, fichiers, docs XML, ERP
Contrôlent les données
Effectuent la sélection
Homogénéisent les données
o Identifiant client, produit
Regroupent, agrègent, recodifient, trient
4. Processus Extract, Transform, Load (ETL)
4
o extraire les données de sources hétérogènes (extract)
o identifier les données des sources utiles
o déterminer les données qui ont changé
o consolider les données (transform)
o données redondantes, manquantes, incohérentes, etc.
o Découpage, fusion, conversion, agrégation, etc.
o Charger les données intégrées dans l’entrepôt (load)
o mode différé ou quasi temps réel.
5. 5
extraction des données en mode différé
Extrait tout les changement survenus durant une période donnée
(ex : heure, jour,semaine,mois)
6. 6
Extraction des données en mode temps réel
s’effectuent au moment ou les transaction surviennent
dans les systèmes sources
7. 7
Chargement des données
• Faire les changements en lot dans une période
creuse (entrepôt de données non utilisé)
• considérer la bande passante requise pour le
chargement
• avoir un plan pour évaluer la qualité des
données chargées dans l’entrepôt
• commencer par charger les données des tables
de dimension