Dal dato in azienda alla conoscenza strutturata per effettuare scelte di business puntuali e precise. Cos'è e a cosa serve il data warehouse in un progetto di Business Intelligence.
2. Le informazioni in azienda
• In azienda, la disponibilità di informazioni cresce in
modo esponenziale.
• Alle sorgenti dati presenti sui sistemi ERP tradizionali, si
affiancano sempre più informazioni esistenti su:
o Sistemi dipartimentali di fabbrica, su soluzioni verticali per
specifiche esigenze, come Gestione Qualità, Previsioni della
Domanda, etc.
o Soluzioni di Customer Relationship Management.
o Il web e i mondi social.
Il tutto con tecnologie e media
molto diversi tra loro.
3. Il processo decisionale
• Chi deve prendere decisioni in azienda ha bisogno di
conoscere e comprendere i fenomeni che saranno poi
oggetto di scelte di business.
• E’ fondamentale riuscire a dare risposte puntuali e
tempestive a domande quali:
o Quanto sono efficienti le mie linee di produzione?
o Mi sto garantendo la giusta marginalità sui prodotti?
o In questi mesi sono allineato al budget di vendita oppure no?
o Qual è l’andamento delle vendite per agente negli ultimi 5
anni?
o I livelli di servizio dei miei fornitori sono cambiati rispetto agli
SLA concordati?
4. Dal dato all’informazione alla
conoscenza
• Le aziende sono ricche di dati, meno di informazioni ed ancora meno di
conoscenza. Vediamo il processo attraverso un esempio:
o 12Ah di capacità (amperaggio) dato elementare (dato base)
o Capacità riferita ad una batteria informazione (dato contestualizzato)
o Un’automobile non può usare una batteria da 12Ah in quanto di potenza
inadeguata, una motocicletta invece sì conoscenza
• Ma il percorso che porta dal dato elementare alla conoscenza aziendale
non è così semplice.
5. Una conoscenza lacunosa
• Questa difficoltà si manifesta in una disponibilità informativa,
ovvero in una conoscenza di impresa, che spesso risulta essere:
o Inadeguata - Non è quello che voglio io!
o Tardiva - Non posso aspettare tutto questo tempo.
o Incompleta - Mi manca quel dato! Come faccio a fare il
raffronto?
o Incongruente - Ma perché vengono numeri diversi?
o Dispersiva - Non posso guardare report e sistemi diversi!
o Non business-oriented - Non si capisce... Non posso avere
una presentazione diversa?
o Errata - Non ci siamo... Questi numeri
non sono giusti!
6. Vincoli tecnici – parte 1
• Quali possono essere le motivazioni di questa situazione?
Ecco alcune possibili spiegazioni di carattere tecnico:
o I sistemi ERP (gestionali in senso lato) sono progettati per attività di
tipo operativo e non per attività di analisi e reporting orientata al
business.
o Nei sistemi ERP non sono presenti dati con adeguata profondità
storica che sono indispensabili per analisi statistiche di business.
o Nel mondo ERP i dati sono gestiti per consentire un’operatività
quotidiana e non sono organizzati in un’ottica di business. Risultano
quindi essere nativamente poco utilizzabili per un decision maker.
o Sempre più spesso per "conoscere" è necessario elaborare dati
presenti su media e tecnologie eterogenee.
7. Vincoli tecnici – parte 2
oPer loro stessa natura, i dati nei sistemi gestionali sono
in continua modifica ed evoluzione, cosa spesso
incompatibile con la comprensione dei fenomeni
aziendali.
oIl significato delle informazioni disponibili non è sempre
coerente in tutti i supporti (gestionale, dipartimentali,
sistemi delocalizzati, etc).
oI tempi di calcolo ed elaborazione e le soluzioni di analisi
e reporting presenti nei sistemi ERP spesso non sono in
grado di supportare il processo decisionale dei manager.
oManca un processo di certificazione dei dati presenti che
possa "battezzare" il dato come ufficiale.
8. Vincoli organizzativi – parte 1
• Ma esistono motivazioni anche sul fronte organizzativo:
o Le aziende storiche e con turnover mediamente contenuto,
contengono spesso "isole di conoscenza" :
Qualche volta poco inclini a condividere le conoscenze acquisite negli anni.
L’azienda non si preoccupa della loro esistenza finché non vengono a
mancare.
o La presenza di più strutture "produttrici" di informazioni fa
crescere il rischio che allo stesso oggetto di business vengano
attribuiti significati e valori diversi.
o La mancanza di una visione unitaria e strategica delle scelte
IT, a volte innesca scelte ‘discutibili’ di delocalizzazione o altro
dei sistemi informativi a tutto svantaggio di una visione
unitaria della conoscenza di impresa.
9. Vincoli organizzativi – parte 2
oSpesso il mondo IT si rivela poco attento alle esigenze di
conoscenza dei manager aziendali, dimostrando
primario interesse per la tecnologia senza considerare la
stessa a supporto del business.
oD’altra parte, si possono riscontrare anche atteggiamenti
"coercitivi" da parte di manager o vertici aziendali che
spingono/impongono soluzioni tecniche "di parte" poco
integrate nell’ecosistema, a discapito delle
problematiche di gestione della filiera informativa tra
sistemi.
10. Quale soluzione?
• Da una parte, abbiamo una disponibilità di informazioni
crescente e sempre più estesa anche ad ambiti ‘esterni’
all’azienda.
• Dall’altra, vi è il fabbisogno di conoscenza delle imprese e
dei suoi manager che cresce in modo altrettanto veloce in
un contesto di mercato sempre più rapido e competitivo.
• Va quindi individuata una soluzione che permetta di
attingere al patrimonio informativo disponibile in azienda,
trasformando i dati disponibili nei diversi supporti e nelle
diverse tecnologie in conoscenza del business, a supporto
dei processi decisionali.
11. Il data warehouse
• La risposta a questa esigenza è la realizzazione di un Data
Warehouse.
• Vale a dire l’implementazione di un ambiente che contenga
informazioni, acquisite dalle fonti dati aziendali,
opportunamente certificate ed organizzate.
• Inoltre, sarà in grado di supportare in modo semplice,
efficace ed intuitivo le attività di analisi e reporting svolte
dai decision maker.
12. I benefici del data warehouse – parte 1
• Un unico ambiente certificato per la diffusione di
informazioni e conoscenza aziendale.
• Storicizzazione delle informazioni.
• Fruibilità del sistema in realtà distribuite da un punto di vista
geografico.
• Utilizzo di diverse tecnologie dall’elevato look & feel (web,
mobile, etc) come front-end per la visualizzazione delle
informazioni.
• Realizzazione di un lessico comune aziendale.
• Costruzione di un repository della conoscenza aziendale
indipendente dalle evoluzioni tecnologiche.
• Gestione di grosse moli di dati.
13. I benefici del data warehouse – parte 2
• Certificazione del processo di caricamento
• Possibilità di navigare nel DW con le funzionalità tipiche di
questi strumenti quali:
o Aggregazione dei dati a diversi livelli
o Possibilità di vedere la stessa informazione da più punti di vista
• Documentazione di processi e strutture dati a tutto
vantaggio della diffusione del know-how aziendale.
• Innesco di processi di miglioramento sia lato tecnico che
organizzativo in una visione globale della filiera del dato.
15. Cosa significa implementare un Data
Warehouse
• Il cuore di un sistema di analisi e reporting è senza dubbio la
banca dati costruita acquisendo i dati dai sistemi
alimentanti.
• È su questa, infatti, che poi insistono i prodotti specifici di
interrogazione. Per questo motivo, i passi per la
realizzazione di questo ambiente sono in estrema sintesi:
o Individuazione ed analisi delle fonti dati.
o Progettazione ed implementazione di una banca dati
multidimensionale (Data Warehouse vero e proprio) ovvero aventi
caratteristiche tecniche adeguate alle necessità analitiche
successive.
o Sviluppo delle procedure di alimentazione della banca dati con
utilizzo di strumenti ad hoc (ETL).
o Customizzazione dello strumento di frontend (scelto in precedenza,
se possibile alla fine della fase di analisi) per permettere le attività
di analisi e reporting.
16. Architettura del Data Warehouse – vista 1
Fonte: Pasini, Perego –
L’evoluzione dei Sistemi
di Business Intelligence
17. Architettura del Data Warehouse – vista 2
Livello delle
Sorgenti
Analisi OLAP
Data Mining
Reporting
Staging
Area
Metadati
What-if
MOLAP
ROLAP
Data Mart
Flat file
OLTP
Fonti
esterne
Extract
Trasform
Load
Dati Informazione Conoscenza
Livello Staging
Area
Livello di
Presentazione
Livello di
Analisi
Enterprise Data Warehouse
18. Condivisione di
dimensioni
SORGENTI
DATI
MODELLI:
Previsionali
Data Mining
Scoring
ETC.
OLAP
QUERY
REPORTING
Estrazione
Estrazione
Estrazione
Memorizzazione:
file piatti
RDBMS
Altri
Processi:
Pulizia
Integrazione
Standardizzazione
Trasformazione
Strutturazione in
dimensioni
Eliminazione duplicati
Esportazione verso i Data
Mart
P & R
Popolamento &
Ripristino
P & R
DATA MART #1
ROLAP/MOLAP/HOLAP
Dimensional
Locally implemented
User group driven
May store atomic data
May be frequently refreshed
Conform to DW bu
DATA MART #2
DATA MART #3
DATA STAGING AREA
Fruizione
DATA MART AREA
Condivisione di
dimensioni
DW BUS
DW BUS
ACCESSO AI DATI
Data Warehousing
I processi del sistema di Data
Warehousing
20. Ulteriori benefici strategici di un Data
Warehouse
• Come abbiamo visto, l’implementazione di un
ambiente DW mette a disposizione dell’azienda una
serie di strumenti di supporto decisionale fondamentali
per garantire il controllo delle performance aziendali.
• Ma una corretta realizzazione di tale ambiente
permette di cogliere anche alcuni obiettivi di portata
strategica assolutamente da non sottovalutare.
• Vediamo di capire quindi il valore aggiunto che può
dare una corretta progettazione di un ambiente DW.
21. Obiettivo 1: Documentazione di dati e
processi
• La progettazione del DW richiede l’analisi puntuale
delle fonti dati di alimentazione del DW stesso:
anagrafica articoli, anagrafica clienti, ciclo attivo, ciclo
passivo, etc.
• L’analisi è necessaria per poter capire:
o Gli oggetti di business da mappare sul DW.
o I processi che li governano.
• Tutto questo viene documentato a vari livelli
(documento di progetto, CASE di progettazione della
banca dati multidimensionale, documento di mapping
tra source e target, etc) e costituisce una fotografia
importantissima del contenuto informativo e di
processo reali in essere in azienda.
22. Obiettivo 2: Stimolo al miglioramento
qualitativo di dati e processi
• La documentazione prodotta costituisce una fotografia
importantissima dell’azienda, specialmente se nella stessa le
soluzioni informatiche sono presenti da tempo.
• Dalla documentazione prodotta possono emergere (e quasi
sempre succede) situazioni errate, prassi organizzative
sbagliate, uso scorretto di dati e procedure, etc, che
inducono a momenti di riflessione e di correzione di tali
anomalie.
• Si innesca così un processo virtuoso che introduce iniziative
di miglioramento. Per inciso, tale processo non termina in
questa fase: sarà l’uso stesso del DW e dei suoi strumenti
che porterà ad evidenziare possibili ulteriori azioni
correttive grazie alla facilità d’uso dello strumento stesso.
23. Obiettivo 3: Archivio storico della
conoscenza aziendale
• Per sua natura, il DW deve contenere serie storiche con
profondità temporale importante relativamente agli
oggetti trattati (ciclo attivo, ciclo passivo, acquisti,
produzione, etc).
• È impensabile, infatti, che sul gestionale vengano
mantenuti anni ed anni di dati appesantendo così il
sistema anche nella quotidianità (performance, backup,
etc).
• Progettando quindi l’ambiente anche con questa
finalità, si procede sin da subito a mantenere sia il
contenuto informativo che il livello di dettaglio
necessario a soddisfare esigenze analitiche future in
senso lato.
24. Obiettivo 4: Frontend/backend
"independent"
• Una corretta progettazione di un DW deve garantire il più
possibile l’indipendenza rispetto alle possibili modifiche
introdotte sia sugli strumenti di frontend (Qlikview, SAP BO,
Microstrategy, Oracle BI, Cognos, etc) che sulle fonti dati
(backend). In altre parole:
o Se l’azienda decide di cambiare lo strumento di analisi e
reporting o di introdurne uno ulteriore, deve essere possibile
agganciarsi ai Data Mart prodotti senza dover riprogettarli o
dover rifare procedure di alimentazione.
o Se l’azienda decide di adottare nuove soluzioni gestionali,
ancora una volta deve essere possibile riusare al massimo
l’ambiente DW esistente, intervenendo solo sull’ETL. Anzi, in
queste situazioni, il DW diverrà il ‘forziere’ informativo
dell’azienda, che garantirà il mantenimento e l’uso del
patrimonio informativo accumulato.
25. Obiettivo 5: Banca dati per analisi
statistiche
• Gli strumenti di analisi predittiva e di data mining si
stanno diffondendo sempre più nelle aziende, grazie
anche alle capacità di calcolo sempre maggiori dei
computer ed all’aumentata disponibilità informativa.
• Il DW costituisce un candidato ideale per attività di data
mining ed analisi predittive, purchè al suo interno i dati
siano presenti con la granularità necessaria (es.
dettaglio scontrino di una GDO) e siano stati oggetto
delle opportune attività di data cleansing.
• Quest’ultima attività, peraltro, è un must di un
ambiente di Data Warehouse che deve garantire una
qualità "eccellente" delle informazioni poi rese
disponibili agli utenti.