Eén jaar werkgroep kennis- en informatiemanagement
Beleidsinformatie id zorg
1. BELEIDSINFORMATIE i/d ZORG
van gegevens naar datawarehouse naar business intelligence
1
NVKVV
OPLEIDING
INFORMATIESYSTEEMVERPLEEGKUNDIGE
17/01/2014
Koen De Meester
Adviseur Beleidsinformatie
AZ Sint-Lucas Gent
18/01/2014
3. Wat
Gegevens informatie
3
Informatie bestaat uit gegevens (synoniem: data)
waar een betekenis aan is toegekend.
Strikt genomen staat in een boekwerk dan ook nooit
informatie, maar slechts gegevens.
De betekenis die een lezer aan de gegevens toekent, vormen
informatie voor die persoon.
“Gent” & “Oost-Vlaanderen” zijn gegevens, waar op zichzelf geen
betekenis in zit. De betekenis die daar in wordt gelegd als in “Gent
is de provinciehoofdstad van Oost-Vlaanderen” is informatie die
gebaseerd is op die gegevens.
18/01/2014
4. Wat
Gegevens informatie
4
Informatie =
individueel relevante deel van hetgene een waarnemer (=de
ontvanger) van binnengekomen (=ontvangen) gegevens maakt
hetgene dat aan de kennis van de waarnemer bijdraagt door
het hebben van betekenis of nieuwswaarde waardoor het van
belang is voor het handelen van de waarnemer.
Waarheid is perceptie!
Het is ontvanger die bepaalt wat op een bepaald moment wel
of geen informatie is.
18/01/2014
14. Historiek
14
„A Business Intelligence System' (Luhn, 1958)
Proces waarbinnen gegevens worden omgezet tot informatie,
die vervolgens leidt tot kennis.
The availability of documents in machinereadable form is a basic requirement of the
system. Typewriters with paper-tape punching
attachments are already used extensively in
information processing and communication
operations. Their use as standard equipment in
the future would provide machine-readable
records of new information. The transcription
of old records would pose a problem, since in
most cases it would be uneconomical to
perform this job by hand. The mechanization of
this operation will therefore have to wait until
print-reading devices have been perfected.
18/01/2014
15. Doelstelling?
15
De belangrijkste
doelstelling van BI
binnen een organisatie is
om geavanceerde kennis
van zaken te leveren aan
kenniswerkers en
managers waardoor deze
in staat zijn betere keuzes
te maken die leiden tot
succesvolle acties.
18/01/2014
22. Bronsystemen
22
Data in de context van BI
Representatie van een organisatie en haar omgeving bij de
dingen, mensen, locaties, gebeurtenissen en de onderlinge
relaties.
Bronsystemen
Operationele systemen binnen de organisatie
Referentiedatabanken buiten de organisatie
http://statbel.fgov.be/nl/statistieken/cijfers/
Separate registraties binnen en buiten de organisatie
18/01/2014
30. Bronsystemen
Bron van data, bron van ellende…?
30
Transactionele databank & de gevolgen
Ontwikkeld om data te verzamelen
1 lijn per klant met alle informatie…
Niet ontwikkeld om data te bevragen
Traag, belastend voor productieomgeving
Nood aan data-integratie van aparte silo‟s + gevaar
rapportvernietiging door wijzigingen in bronstructuur
Iedereen heeft eigen versie van de waarheid…
http://www.jdesource.com/business-intelligence/data-warehousing-in-lay-mans-term/
18/01/2014
34. Concept v/h datawarehouse
Definitie
34
« een data warehouse (datapakhuis) is het hart van
de infrastructuur voor business intelligence »
« een data warehouse is een kopie van transactionele
data die specifiek geordend is voor opvragen en
analyse »
« een data warehouse is een informatiesysteem voor
de analyse van geïntegreerde, historische data over
een langere tijdsperiode »
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
35. Concept v/h datawarehouse
Definitie – William (Bill) Inmon
35
A subject-oriented, integrated, time-variant, non-
updatable collection of data used in support of
management decision-making processes
« een data warehouse is een onderwerp-
georiënteerde, geïntegreerde en tijdsafhankelijke
gegevensverzameling, die niet of nauwelijks aan
verandering onderhevig is en die het
besluitvormingsproces ondersteunt »
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
36. Concept v/h datawarehouse
Definitie
36
« een data warehouse is een onderwerp-georiënteerde,
geïntegreerde en tijdsafhankelijke gegevensverzameling, die
niet of nauwelijks aan verandering onderhevig is en die het
besluitvormingsproces ondersteunt » (William (Bill) Inmon)
Gegevens in een DWH zijn opgeslagen volgens onderwerp (patiënt,
kwaliteit, pathologie, verpleegeenheid, specialisme…) en niet per IT-systeem
(facturatie, patiëntendossier, …)
Focus op analyse, niet op data-input
Elk systeem bevat slechts een partieel beeld over een onderwerp, data niet
relevant voor beslissingsproces wordt geëxcludeerd
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
37. Concept v/h datawarehouse
Definitie
37
« een data warehouse is een onderwerp-georiënteerde,
geïntegreerde en tijdsafhankelijke gegevensverzameling, die
niet of nauwelijks aan verandering onderhevig is en die het
besluitvormingsproces ondersteunt » (William (Bill) Inmon)
Gegevens uit verschillende heterogene databronnen (relational databases,
flat files, on-line transaction records) worden samengebracht tot een
coherent geheel met eenvormige definities en terminologie
Data cleaning + data integratie
Eénduidige naamgeving en definities; zelfde eenheden; code-structuur
Verschillende types ziekenhuiscontacten, datumstructuren, tijdseenheden,…
Alle data worden éénvormige geconverteerd indien binnengebracht in DWH
Gegevens worden aan elkaar gerelateerd (relationship constraints)
Eigenschappen van de gegevens (metadata) worden centraal opgeslagen
en beheerd
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
38. Concept v/h datawarehouse
Definitie
38
« een data warehouse is een onderwerp-georiënteerde,
geïntegreerde en tijdsafhankelijke gegevensverzameling, die
niet of nauwelijks aan verandering onderhevig is en die het
besluitvormingsproces ondersteunt » (William (Bill) Inmon)
Snapshots van de gegevens worden opgeslagen op verschillende tijdstippen
als basis voor historische overzichten
Een datawarehouse bevat vaak meer historische gegevens dan de originele
bronsystemen, zowel over snel als over langzaam veranderende gegevens
(typisch over een periode van 5 à 10 jaar)
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
39. Concept v/h datawarehouse
Definitie
39
« een data warehouse is een onderwerp-georiënteerde,
geïntegreerde en tijdsafhankelijke gegevensverzameling, die
niet of nauwelijks aan verandering onderhevig is en die het
besluitvormingsproces ondersteunt » (William (Bill) Inmon)
Een DWH is een gerichte verzameling van gegevens
Gegevens in een DWH zijn losgekoppeld van de processen en omgeving
waarin ze zijn ontstaan
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
40. Concept v/h datawarehouse
Definitie
40
« een data warehouse is een onderwerp-georiënteerde,
geïntegreerde en tijdsafhankelijke gegevensverzameling, die
niet of nauwelijks aan verandering onderhevig is en die het
besluitvormingsproces ondersteunt » (William (Bill) Inmon)
In principe zijn in DWH geen veranderingen aan opgeslagen gegevens
mogelijk: de gegevens zijn niet-vluchtig (non-volatile)
Gewijzigde waarden worden opgeslagen als een nieuw gegeven in
tegenstelling tot operationele systemen waar nieuwe waarden oude
overschrijven
Enkel zicht op huidige waarde (vb. Overschrijven adres na verhuis)
Rapportage over gegevens uit DWH blijft reproduceerbaar
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
41. Concept v/h datawarehouse
Definitie
41
« een data warehouse is een onderwerp-georiënteerde,
geïntegreerde en tijdsafhankelijke gegevensverzameling, die
niet of nauwelijks aan verandering onderhevig is en die het
besluitvormingsproces ondersteunt » (William (Bill) Inmon)
Gebruikers van DWH zijn geen IT-ers maar komen ‘business-side’
DWH heeft als doel om gerichter beslissingen te kunnen nemen, om beleid
beter te kunnen voorbereiden, uit te tekenen en uit te voeren
Design van DWH is specifiek om op performante wijze opzoekingen
(queries) te doen in gegevens
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
42. Concept v/h datawarehouse
Operationele database >< Datawarehouse
42
Operationele database
Datawarehouse
Inhoud
Huidige waarden, gedetailleerde
gegevens
Historische gegevens,
geconsolideerde en geaggregeerde
gegevens
Reikwijdte
Specifiek functioneel systeem
Volledige organisatie
Doel
Ondersteuning dagdagelijkse
operaties
Informatievoorziening, rapportage en
analyse
Toestand
Redundante en onvolledige
gegevens
Geïntegreerde, volledige gegevens
Soort gegevens
Dynamisch: gegevens wijzigen
Voortdurend
Statisch: gegevens blijven
onveranderd opgeslagen
Structuur
Complex, geschikt voor
operationeel gebruik
Eenvoudig en eenduidig, geschikt
voor analyse
Gebruik
Gericht op efficiëntie van
transacties
Gericht op effectiviteit van analyses
Aanpasbaarheid
Gegevens kunnen bijgewerkt
worden
Gegevens kunnen niet gewijzigd
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
49. ETL proces
Extract
49
Capture = extract…snapshot nemen van de
beperkt deel brondata en laden in DWH
Statische extractie = snapshot van
de bron op bepaald ogenblik in tijd
Incrementele extract =
waarnemen van de wijzigingen sinds
laatste statische extractie
18/01/2014
50. ETL proces
Extract
50
Scrub = data cleansing
Datakwaliteit verbeteren door
patroonherkenning etc…
Fouten corrigeren: schrijffouten;
ontbrekende/dubbele/inconsistente
data; onmogelijke datums; incorrect
veldgebruik
Ook: decoding; herformatteren,
tijdsstempel; conversie; …
18/01/2014
51. ETL proces
Transform
51
Transform = omzetten van dataformaat
operationeel systeem naar formaat DWH
Record-level:
Selection – data partitie
Joining – data combinatie
Aggregation – data samenvatting
Field-level:
Single-field – van 1 veld naar 1 veld
Multi-field – meerde velden naar 1 of
omgekeerd
18/01/2014
52. ETL proces
Transform: single field
52
In general – some transformation
function translates data from old form
to new form
Algorithmic transformation
uses a formula or logical
expression
Table lookup – another approach
18/01/2014
53. ETL proces
Transform: multi field
53
M:1 –from many source
fields to one target field
1:M –from one
source field to
many target
fields
18/01/2014
54. ETL proces
Load
54
Load/Index= vullen van DWH met
getransformeerde data en indexering
Refresh mode:
Volledig overschrijven van de DWH
info op periodische intervallen
Update mode:
Enkel de wijzigingen in de brondata
worden overgebracht naar DWH
18/01/2014
58. Metadata
58
Data over data…
Wat betekent data precies 1 waarheid
Voorbeelden:
Gegevens over definities, eigendom, herkomst, betrouwbaarheid,
recentheid, berekeningswijze, normen, vertrouwelijkheid,…
Gegevens over de betekenis van entiteiten en hun attributen, bij
voorkeur in niet ambigue en begrijpelijke bewoordingen, al dan
niet aangevuld met synoniemen of een thesaurus
Technische gegevens over tabellen, kolommen, indexen en relaties
in de database of datamodel
Technische gegevens over de manier waarop gegevens uit
bronsystemen worden getransformeerd, gecombineerd en
verplaatst in DWH/datamarts
Beschikbare aggregaties/totaaltellingen
18/01/2014
61. Architectuur v/h datawarehouse
61
1. Generic DWH Architecture
2. Independent Data Mart
3. Dependent Data Mart
4. Complimentary Data Mart
5. Dependent Data Mart and Operational Data Store
6. Logical Data Mart and @ctive Warehouse
18/01/2014
62. Architectuur v/h datawarehouse
1. Generic DWH Architecture
62
E
T
L
1 generiek
organisatiebreed DWH
Niet meest recente data – oplaadfase
18/01/2014
63. Architectuur v/h datawarehouse
1. Generic DWH Architecture
63
Voordelen
Optimale instellingsbrede integratie
Nadelen
Top down
Tijdsrovend, laat resultaat
Investeringskost
Invoering van datamarts
~DWH, maar meestal met kleinere hoeveelheid gegevens en
vaak ingericht voor specifiek doel
18/01/2014
65. Architectuur v/h datawarehouse
2. Independent Data Mart
65
E
T
L
Aparte ETL voor elke
independent data mart
Complexe toegankelijkheid door
verschillende data marts
18/01/2014
66. Architectuur v/h datawarehouse
2. Independent Data Mart
66
Independent / Alleenstaande / Stand-alone DM
DM is DWH op kleine schaal (voor bepaalde dienst of
departement) gegevens in DM zijn enkel afkomstig van
bepaalde dienst of departement; DM bevat weinig of geen
algemene bedrijfsgegevens
Vooral gebruikt binnen sterk gedecentraliseerde organisaties
(bv. voor specifieke onderzoeksgroepen die
onderzoeksgeheimen bevatten)
Alleenstaande datamarts kunnen nooit een datawarehouse
vervangen wegens verlies aan authenticiteit: multiple views of
single truth i.p.v. multiple views of multiple truths
18/01/2014
67. Architectuur v/h datawarehouse
3. Dependent DM
67
E
T
L
1 ETL voor enterprise data
warehouse (EDW)
Eenvoudiger toegang
Afhankelijke DM exclusief
geladen vanuit EDW
18/01/2014
68. Architectuur v/h datawarehouse
3. Dependent DM
68
Dependent / Afhankelijke / Afgeleide / Derived DM
Uit organisatiebreed allesomvattend DWH worden één of een
aantal DMs afgeleid
DM haalt data rechtstreeks en exclusief uit DWH
Laat eindgebruikers toe om direct op zeer performante manier
gebruik te maken van gegevens in DM evenals van de meer
gedetailleerde informatie in het DWH
Sterk gewaardeerde oplossing: voordelen van DM worden
verbonden met kracht van DWH
69. Architectuur v/h datawarehouse
4. Complimentary DM
69
E
T
L
Eenvoudiger toegang
Complimentary DM hoofdzakelijk
geladen vanuit EDW
18/01/2014
70. Architectuur v/h datawarehouse
4. Complimentary DM
70
Complimentary / Aanvullende DM
Organisatiebreed DWH wordt aangevuld met aantal DM om
allesomvattend te zijn
DM haalt gegevens grotendeels uit DWH maar ook uit
operationele systemen (of extern)
Interessant indien gegevens enkel relevant zijn voor één
afdeling of dienst (bv. personeelsadministratie) maar wel
moeten gerelateerd zijn aan DWH stamgegevens
Zelden toegepast wegens gevaar voor inconsistentie van
gegevens tussen DM en DWH: gegevens in DM zijn meer
gedetailleerd dan in DWH
Prof. B. Sijnave - Management van informatie(systemen) -2009
18/01/2014
71. Architectuur v/h datawarehouse
5. Operational Data Store + Dependent DM
71
ODS maakt gebruik huidige data mogelijk
E
T
L
1 ETL voor enterprise data
warehouse (EDW)
Eenvoudiger toegang
Afhankelijke DM geladen
vanuit EDW
18/01/2014
72. Architectuur v/h datawarehouse
5. Operational Data Store + Dependent DM
72
Operational data store (ODS):
An integrated, subject-oriented, updatable, current-valued,
enterprise-wise, detailed database designed to serve
operational users as they do decision support processing.
73. Architectuur v/h datawarehouse
6. Logical Data Mart and @ctive Warehouse
73
ODS & DWH zijn hetzelfde
E
T
L
Bijna real-time ETL
DM geen aparte databases, maar
logische views v/h DWH
Eenvoudiger nieuwe DM maken
18/01/2014
74. Architectuur v/h datawarehouse
6. Logical Data Mart and @ctive Warehouse
74
@active data warehouse: An enterprise data
warehouse that accepts near-real-time feeds of
transactional data from the systems of record,
analyzes warehouse data, and in near-real-time
relays business rules to the data warehouse and
systems of record so that immediate actions can be
taken in response to business events.
18/01/2014
76. Data model
Meetwaarden en dimensies
76
Meetwaarden / Feiten / Cijfers / Measures
Getallen die gerapporteerd kunnen worden
Patiënten, ziekenhuiscontacten, opnames, transfers, ontslagen,
uitgevoerde en/of gefactureerde prestaties, ligdagen, ingrepen, etc.
Feiten krijgen betekenis door te rapporteren in combinatie met
gerelateerde dimensies
Dimensies / dimension
Nadere informatie over datgene waarop getallen betrekking hebben
Tijd, patiënt, arts, diagnose, pathologiegroep, behandeling, leeftijd,
geslacht, verpleegeenheid…
Bevatten attributen, die elk bepaald aspect van dimensie beschrijven
Attributen uit de tijd-dimensie : jaar, maand, week en dag.
18/01/2014
77. Data Model
Hiërarchie / niveaus
77
Hammergren C. et al. 2009 - Datawarehousing for dummies; Slidesharenet
18/01/2014
79. Data Model
Granulariteit
79
Detailniveau van
de feiten in een
feitentabel.
Granulariteit/detailgraad van feitentabel
Transactioneel niveau : fijnst
Gearggregeerd : tot op wel niveau? Te bepalen
Meer verfijnd – meer opties voor analyse
Meer verfijnd – meer dimensietabellen, meer rijen in feitentabel,
zwaarder, minder performant
Hammergren C. et al. 2009 - Datawarehousing for dummies; Slidesharenet
18/01/2014
84. Data model
Sterschema: beperkingen
84
Sleutels/keys in dimensietabellen zijn niet business
gerelateerd en dus niet begrijpbaar voor
eindgebruiker
Sleutels kunnen veranderen in tijd
Moeten consistent zijn in lengte/formaat
18/01/2014
85. Data model
Sneeuwvlok schema
85
Uitgebreide versie van sterschema, waarbij dimensie
tabellen zijn genormaliseerd naar meerdere
gerelateerde tabellen
Voordelen
(Beperkt) minder
opslagruimte
Door normalisatie beter
onderhoud- & aanpasbaar
Nadelen
Schema minder intuïtief
Queries minder performant door groter aantal joins/verbindingen
18/01/2014
86. Data model
Sneeuwvlok schema
86
time
time_key
day
day_of_the_week
month
quarter
year
item
Sales Fact Table
time_key
item_key
branch_key
branch
location_key
branch_key
branch_name
branch_type
units_sold
dollars_sold
avg_sales
Measures
item_key
item_name
brand
type
supplier_key
supplier
supplier_key
supplier_type
location
location_key
street
city_key
city
city_key
city
province_or_street
country
18/01/2014
87. Data model
Multiple fact tables
87
>1 feitentabel in het midden van sterschema
2 Feitentabellen
Sales + Receipts
Gezamelijke dimensie
Date
18/01/2014
88. Data model
Factless facttables / Feitenloze feitentabel
88
Feitentabel bevat buiten key‟s geen andere gegevens
Opvolgen/opsporen events (occurrences)
Inventariseren van mogelijke voorvallen (coverages)
Occurence
Coverage
18/01/2014
90. Ziekenhuisdatawarehouse
90
Hoe ver kan / moet / wenst de instelling te gaan?
Generieke ontwikkeling
Basis-modules
Toeters en bellen…
Instellingsspecifieke ontwikkeling
Interne BI-cel en/of IT-dienst
Externe consultants
Wat als data niet aanwezig is in datawarehouse?
“Bronloze” gegevens
Forcea
18/01/2014
94. Querying & reporting
94
Traditionele benadering van data-analyses
Op ogenblik van vraagstelling (ad hoc of structureel rapport)
wordt data bevraagd met behulp van query
Formattering van resultaat in rapport (ad hoc / sjabloon)
Meestal via standaard procedure:
1. Vraag tot rapport
2. Ophalen resultaat
3. (Beperkte) manipulatie van de data
4.
5.
Samenvatten; totaliseren; herordenen,…
Formatteren van de data
Aanbieden rapport 1-malig of regelmatig
Hammergren C. et al. 2009 - Datawarehousing for dummies
18/01/2014
95. Querying & reporting
SQL (Structured Query Language)
95
ANSI/ISO-standaardtaal voor een relationeel
databasemanagementsysteem (DBMS)
Bevragen en aanpassen gegevens in relationele gegevensbank
Initieel ontwikkeld als vraagtaal voor eindgebruiker
gebruik van SQL impliceert volledige kennis van de structuur van
de te ondervragen gegevensbank te complex!
Voorbeeld:
SELECT *
FROM tblKlanten
WHERE tblKlanten.krediet < 0;
Hammergren C. et al. 2009 - Datawarehousing for dummies; WIKEPDEDIA
18/01/2014
96. Querying & reporting
Tools
96
Functionaliteiten
Aanmaken standaard rapporten
M.b.v. data uit datawarehouse, operationele databases (of kopie)
Herhalend op regelmatige basis
Statisch
Taakbelastend
One version of the truth…
Hammergren C. et al. 2009 - Datawarehousing for dummies
18/01/2014
97. Querying & reporting
Tools
97
Functionaliteiten
Lijsten
Hammergren C. et al. 2009 - Datawarehousing for dummies
18/01/2014
98. Querying & reporting
Tools
98
Functionaliteiten
Kruistabellen
Hammergren C. et al. 2009 - Datawarehousing for dummies
18/01/2014
99. Rapporteringskeuzes
99
Op papier
Statisch elektronisch
Dynamisch elektronisch
Wie mag wat zien?
Distribueer je data of rapporten?
Kan de gebruiker er ook zelf iets mee doen?
Kan je distibutie automatiseren?
18/01/2014
100. Statisch rapport
Hoe voorstellen
100
Evolutie
Absoluut (Δn) idee werkelijke grootte, impact op totaal
Procentueel (Δ%) belang i.f.v. eigen positie
Bij voorkeur gewogen waarde
Vergelijkbaar maken van resultaten
Gezamenlijke noemer (ligdagen, activiteitsdagen, FTE)
Het plaatsen van een meting in zijn perspectief
Patiëntidentificatie
Decubitus
Tevredenheid…
18/01/2014
101. Statisch rapport
Statistiek: enkele basisbegrippen
101
Gemiddelde
Mediaan
Kwartiel
Percentiel
Standaarddeviatie
http://www.let.leidenuniv.nl/history/RES/stat/html/excel_be.html
18/01/2014
102. Statisch rapport
Veel gebruikte dimensies
102
Tijdsdimensie
Dag; Week; Maand; Kwartaal; Semester
Zeer herkenbare referentieperioden
Impact weekend, vakantie- en brugdagen bij kleine referentie
Jaar tot Datum (YTD / JTD)
Boekhoudkundig begrip, werken naar jaarresultaat
Weinig relevant gedurende eerste kwartaal
Voortschrijdend Jaar / Rolling Year / Moving Year (12M)
Uitvlakking seizoensschommelingen
Abstract gegeven
Voortschrijdend Gemiddelde
18/01/2014
108. OLAP (online analytical processing)
Business Analysis
108
Interactief analyseren van
gegevens i/h DWH
Data doorgaans voorgesteld als
en gemanipuleerd in kubussen
multidimensionele
matrices / spreadsheets
Analyse vs. Rapportering
Rapport = antwoord op 1 specifieke vraag
Hoeveel klassieke hospitalisaties voor een bepaalde campus
Analyse = zoeken verklaring voor een business vraag via relaties
tussen gegevens
Wat verklaart de daling in de klassieke hospitalisaties
Hammergren C. et al. 2009 - Datawarehousing for dummies; Slidesharenet; Forcea
18/01/2014
112. OLAP-functionaliteiten
Slicing
112
Afzonderen van 1 data”schijf” binnen kubus
Selectie van 1 waarde in 1 van de dimensies
Creëren van kleinere kubus met minder dimensies
Hammergren C. et al. 2009 - Datawarehousing for dummies; Wikipedia
18/01/2014
113. OLAP-functionaliteiten
Dicing
113
Aanmaken van een deelkubus
Selectie meerdere waarden binnen 1 of meer dimensies
Hammergren C. et al. 2009 - Datawarehousing for dummies; Wikipedia
18/01/2014
114. OLAP-functionaliteiten
Drill Down/Up
114
Navigeren (down/up) tussen hiërachiën
Up: naar meest geaggregeerde/samenvattende
Down: naar hogere graad van detail
Hammergren C. et al. 2009 - Datawarehousing for dummies; Wikipedia
18/01/2014
117. OLAP
Types
117
MOLAP - Multidimensioneel
Traditionele benadering; data bewaard in
multidimensionele kubus en niet in de relationele
database
Voordelen:
Performantie
• MOLAP kubussen zijn gebouwd om snel data op te halen
en geoptimaliseerd voor slicing / dicing
Laat complexe berekeningen toe (binnen korte tijd)
• Alle berekeningen voorbereid in de kubus
Nadelen:
Beperkt in hoeveelheid data gezien alle berekeningen
in kubus gebeuren
• Grote data-sets enkel geaggregeerde gegevens in kubus
Bijkomende investering
• Software: kubus technologie heel specifiek en (vaak) via
specifieke en betalende software
• Personeel & opleiding
Hammergren C. et al. 2009 - Datawarehousing for dummies; Slidesharenet
18/01/2014
118. OLAP
Types
118
ROLAP – Relationeel
Data gemanipuleerd in relationele database, zodat ze
voor eindgebruiker ogenschijnlijk benaderd worden
via OLAP met slicing/dicing functionaliteit
SQL – slice & dice m.b.v. "WHERE" clausule
Voordelen:
Grote databanken kunnen eenvoudig bevraagd
worden
• Capaciteit is “beperkt” tot die van onderliggende
relationele database
• ROLAP zelf heeft geen capaciteitsbeperking
Disadvantages:
Relatief traag, zeker bij grote databanken
• Elk ROLAP rapport is opeenvolging van SQL queries in
relationele databank
Beperkt door SQL functionaliteiten
• Complexe berekeningen zijn vaak moeilijk met SQL
Leveranciers voorzien vaak al zowel voorbereide
queries voor complexe berekeningen als vrijheid om
zelf queries te ontwikkelen
Hammergren C. et al. 2009 - Datawarehousing for dummies; Slidesharenet
18/01/2014
119. OLAP
Types
119
HOLAP – Hybrid
Best-of-both-worlds
MOLAP technologie voor samenvattende informatie via
kubussen
ROLAP naar onderliggende relationele database voor
verdere specificaties en detail
“drill through”
Hammergren C. et al. 2009 - Datawarehousing for dummies; Slidesharenet
18/01/2014
122. OLAP
Types: andere
122
WOLAP (Web-enabled OLAP)
Toegankelijk via web browser
+ lagere investeringskost; betere toegankelijkheid
– functionaliteit, performantie momenteel << client/server machines
DOLAP (Desktop OLAP)
Deel van data lokaal opslaan en van daaruit werken
+ eenvoudig op te zetten en goedkoop
– zeer beperkte functionaliteit & data-eilanden
MOLAP (Mobile OLAP)
OLAP toepassingen mobiel/tablet via remote access
SOLAP (Spatial OLAP)
Combinatie mogelijkheden van Geographic Information Systems
(GIS) & OLAP binnen 1 gebruikers-interface
Hammergren C. et al. 2009 - Datawarehousing for dummies; Slidesharenet
18/01/2014
130. Data mining
What are we talking about…?
130
Data mining is “het ontdekken van kennis” m.b.v.
Statistiek
Artificiële intelligentie
Grafische computertechnieken
…
Doel:
Verklaringen zoeken
Veronderstellingen bevestigen
Data onderzoeken naar nieuwe onverwachte relaties
IBMBusAnalyticsOEM
18/01/2014
131. Data mining technieken
Associatie regels
131
Transaction
Item
t1
milk, chip, bread, salsa, coke
t2
banana, chip, rice, salsa
t3
salsa, coke, banana, chip
t4
milk, lettuce, coke, rice, salsa, bread
t5
lettuce, salsa, bread, coke, chip, milk
Doel: zaken identificeren vinden die samen gebeuren
Support of {salsa, chip} is 80%
Support of {bread, milk} is 60%
Interessant voor o.a. winkelindeling, prijszetting...
IBMBusAnalyticsOEM
18/01/2014
132. Data mining technieken
Clustering
132
Markt segmentatie als voorbeeld
Elk punt stelt eigenschap/karakteristiek van bepaalde klant
voor
Doel: groeperen van leden met zelfde eigenschappen
Gebruikt voor fraude-opsporing, zakenwereld,
wetenschap
IBMBusAnalyticsOEM
18/01/2014
133. Data mining technieken
Statistische analyse
133
Regressie:
VTE‟s
poetsdienst
Opp m²
Tijdsseries:
Patiënten
Tijd
IBMBusAnalyticsOEM
18/01/2014
134. Data mining
Betekenis voor healthcare
134
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
135. Data mining
Betekenis voor healthcare
135
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
136. Data mining
Betekenis voor healthcare
136
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
137. Data mining
Betekenis voor healthcare
137
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
138. Data mining
Betekenis voor healthcare
138
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
139. Data mining
Betekenis voor healthcare
139
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
140. Data mining
Betekenis voor healthcare
140
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
141. Data mining
Betekenis voor healthcare
141
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
142. Data mining
Betekenis voor healthcare
142
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
143. Data mining
Betekenis voor healthcare
143
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
144. Data mining
Betekenis voor healthcare
144
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
145. Data mining
Betekenis voor healthcare
145
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
146. Data mining
Betekenis voor healthcare
146
Desikan P. 2011 – Data mining for Heatlhcare management
18/01/2014
147. Data mining
… a word of caution
147
http://www.abc.net.au/tv/thecheckout/
18/01/2014
150. Internet / Intranet
Portaal
150
Centrale toegang tot alle beleidsdata in DWH
IBM Cognos
Connection
Individueel
instelbaar
afhankelijk van
noden/wensen
eindgebruiker
18/01/2014
151. Dashboard en Balanced Scorecard
151
Dashboards en Balance Scorecards worden gebouwd
om kaderleden de mogelijkheid te bieden om in een
oogwenk de situatie van het bedrijf in te schatten.
Aan de hand van visuele wegwijzers in functie van
zogenaamde KPI‟s wordt goed en slecht
weergegeven, zonder dat er tijd verloren gaat in de
samenstelling van de gegevens die aan dit besluit
vooraf gaan.
“Tell me a lot of things, but don‟t make me work too
hard.”
18/01/2014
152. Dashboard
152
Stelt directieleden en managers in staat om zo snel
mogelijk de situatie van de business in te schatten,
zonder hiervoor enig voorbereidend onderzoek te
moeten verrichten.
Dashboardprincipe is een proactieve wijze van
informatiegebruik die resulteert in acties die enkel
genomen worden wanneer bepaalde vooropgestelde
pointers hierom vragen.
De informatie dient in a glance waarneembaar te
zijn aan de hand van een visuele representatie
(grafieken en wijzers)
18/01/2014
155. (Balanced) Scorecard
155
Visuele uitdrukking van strategie instelling
Veel gebruikte techniek voor strategisch management en het
behalen van langetermijndoelstellingen binnen organisaties.
Evaluatiehulpmiddel voor managers die complexe
doelstellingen hebben.
Het idee achter de balanced scorecard is dat een
manager niet alleen is af te rekenen op financiële
resultaten, maar dat ook andere prestaties worden
meegenomen in de jaarlijkse beoordeling.
Uitgedrukt in KPI (key performance indicators)
18/01/2014
157. (Balanced) Scorecard
157
Verschillende perspectieven
Customer: Kwaliteits- en klantenperspectief
Internal process: Interne processen
In welke processen moeten we excellent zijn om de basis waarden
waar te maken
Employee learning and growth: Medewerkers perspectief
Hoe creëren we waarde voor de patiënten
Hoe kunnen we blijven groeien in competentie om adequate
antwoorden te blijven bieden op een wisselende realiteit
Financial: Financieel perspectief
Hoe kunnen we waarde creëren voor onze klanten terwijl we de
kosten onder controle houden
18/01/2014
164. The Magic Quadrant for BI
164
Methodiek om IT producten te vergelijken
H – "Completeness of Vision“
~ “features” v/h product
~ technologische vernieuwingen
die concurrenten verplichten te
reageren
V – "Ability to Execute"
~ inkomsten, aantal en kwaliteit
van distributeurs/verkopers
~ personeel en verhouding tss.
ontwikkeling/verkoop/support…
Evolutie
Gartner, February 2013 + Louhia consulting, November 2013
18/01/2014
165. BI voor Belgische ziekenhuismarkt
165
www.forcea.be/nl/oplossingen/forcea-healthreport
www.hospitalintelligence.be/modules.php
www.laco.be/nl/markets/healthcare/
www.xperthis.be/nl/business-intelligence/
???
18/01/2014
172. Top 10 Trends
in Business Intelligence
for 2014
www.tableausoftware.com
172
18/01/2014
173. The end of data scientists.Data science moves from the specialist
to the everyman. Familiarity with data analysis becomes part of the skill set of ordinary
business users, not experts with “analyst” in their titles. Organizations that use data to make
decisions are more successful, and those that don’t use data begin to fall behind.
For more, see this Special Report from the Economist: Fostering a Data Driven Culture.
1
174. Cloud business intelligence goes mainstream.
Organizations that want to get up & running fast with analytics drive adoption of cloudbased business intelligence. New scenarios such as collaboration with customers and
outside-the-firewall mobile access also accelerate adoption. The maturation of cloud
services helps IT departments get comfortable with business intelligence in the cloud.
For more, read the whitepaper: Business Analytics in the Cloud.
http://youtu.be/SS1EI5Ql6sI
175. Big data finally goes to the sky.
Cloud data warehouses like Amazon Redshift and Google BigQuery transform the process of
building out a data warehouse from a months-long process to a matter of days. This enables
rapid prototyping and a level of flexibility that previously was not possible. Cloud offerings like
Teradata Cloud and SAP HANA from traditional vendors validate the space.
For more, watch this webinar: Exploring Big Data with Amazon Redshift.
176. Agile business intelligence extends its lead.
Self-service analytics becomes the norm at fast-moving companies. Business people begin
to expect flexibility and usability from their dashboards. And the monolithic infrastructure
stack finally crumbles in favor of solutions that can work with new data sources.
For more, read this whitepaper by GigaOm: Agile Business Intelligence: Reshaping the Landscape.
177. Predictive analytics, once the realm of advanced and specialized
systems, will move into the mainstream as businesses seek forward-looking rather than
backward-looking insight from data.
For more, watch TDWI’s David Stodder on this webinar: Using Analytics to be
Predictive and Proactive.
178. Embedded BI begins to emerge, in an attempt to put insight
directly in the path of business activities. Analytics start to live inside of transactional
systems. Scenarios like customer relationship management will lead the way with analytics
providing support for the many small decisions salespeople make in a day. Ultimately,
embedded BI will bring data to departments that have typically lagged: for example, on the
shop floor and in retail environments.
See the value of embedded BI with this video.
179. Storytelling becomes a priority,
as people realize that a dashboard deluge without context is not helpful. Stories become
a way to communicate ideas and insights using data. They also help people gain
meaning from an overwhelming mass of big and disparate data.
Read more in this whitepaper: 5 Best Practices for Telling Great Stories.
180. mobile business intelligence
becomes the primary experience,
For leading-edge organizations,
not an occasional experience. Business users being to demand access to information
within the natural flow of their day, not back at their desks.
For an example, read this whitepaper: How Mobile Business Intelligence Drives
Efficiency and Transformation for Supervalu.
http://www.youtube.com/watch?v=DeS4m11GYWQ&feature=share&list=PL1xSoMCZ-kYJjNBkxRzr_0FkNTXj_gtDk
181. Organizations begin to analyze social data
in earnest, gaining insight beyond number of their likes and followers. Social
data becomes a proxy for brand awareness and attitude, as well as fertile ground for
competitive analysis. Companies begin to use social data to understand how relevant
they are to their customers.
For an example of how to gain insight from social media data, watch this
video: Using Social Media Analytics for Insight.
http://youtu.be/8AUMEHhVbXA
182. NoSQL is the new Hadoop.
Organizations explore how to use unstructured data. NoSQL technologies become
more popular as companies seek ways to assimilate this kind of data. But in 2014,
the intelligent use of unstructured data will still be the exception and not the norm.
For more on noSQL, read this TechRepublic article: 10 Things You Should Know
About noSQL databases.
185. If you want to read…
…some more…
…all about it...
185
Hammergren C. et al. 2009 Datawarehousing for dummies
Ponniah. P. 2010 – Data
Warehousing fundamentals
18/01/2014