1. 1
Data Analyse
Zeist, 26 september 2017
“Maakt de kracht van data
analyse(s) real-time
beschikbaar voor schade-
afhandelingen en
acceptatie/dynamic
pricing:
meer STP
meer Control
loss ratio
“Maakt de kracht van data
analyse(s) real-time
beschikbaar voor schade-
afhandelingen en
acceptatie/dynamic
pricing:
meer STP
meer Control
loss ratio
2. 2
Over Posthuma Partners
Opgericht in 1997.
Nederlands actuarieel advies bureau en software
bedrijf. Internationaal erkend en wetenschappelijk
gevalideerd door 2 universiteiten.
Activiteiten hebben onder andere betrekking op:
Financiële modellering
Data analyse(s) tooling en advies
3. 3
Data
Data Analyse en Data Mining is het proces van onderzoek en
informatie uit data te halen.
Doel is verkrijgen van inzicht in datasets:
Waar zitten afhankelijkheden?
Hoe verhoudt zich een datapunt ten opzichte van het geheel?
Maar ook:
Is het mogelijk om betrouwbare voorspelling naar de toekomst
toe te maken?
4. 4
Belangrijk voordat je begint
Databegrip
Eenduidig begrip van datavelden
Geen wijzigingen in meetdefinities (wao-ers, ww-ers)
Betrouwbaarheid van data
Start de analyse met een probleemstelling
Koppelen/verrijking van data is nuttig maar gevaarlijk.
Let op:
Sleutel is essentieel
Gelijke definitie van sleutel
Datastempel
5. 5
Valkuilen
Te grote bestanden
Datakwaliteit
Statistische overfitting
Multicollineariteit
Correlatie en causaliteit
6. 6
Voorbeelden correlatie vs causaliteit
Als er meer ijsjes worden verkocht (variabele X) dan stijgt het aantal
verdrinkingen (variabele Y).
wel correlatie
geen causaal verband
11. 11
Voorbeelden correlatie vs causaliteit
Homicide rates have gone down as gun violence has gone up.
Correlatie of causaliteit?
The researchers say they found two main problems.
First, the hospitals used in this representative sample
between 2003 and 2012 had changed over time, probably
skewing the results.
The second problem is that the hospitals also seemed to be
recording the cases a little better over time, marking fewer
gun cases as having "unknown" causes.
12. 12
Technieken
Regressie analyse
Essentieel is te komen tot die covariaten die een sterke relatie
hebben met de te verklaren variabele.
Generalized Linear model (GLM)
Mogelijke methoden voor regressie:
Tijdreeksanalsyse
Stepwise regression (forward, backward, bidirectional)
Lasso (least absolute shrinkage and selection operator)
Simulated annealing
Random forest
Bagging
13. 13
Beschikbare Software
Waar begin je mee: Acces en Excel
Ondersteunende software voor Data analyse en Data mining:
CMF, IFM, ELKI, Dataiku DSS, ITALASSI, R, Data Applied, DevInfo,
Waffles, ILNumerics.Net, jMatLab, R Software Environment, Toolkit,
TANAGRA, Alteryx, MiningMart, RapidMiner, SAS Enterprise Miner,
Oracle Data Mining ODM,...
14. 14
Toepassing: schadebehandelingsprocessen
In de meeste gevallen steunen verzekeraars op:
Een ‘regelset’ in hun systeem
(gebaseerd op de polisvoorwaarden en enkele extra regels)
De aandacht en kennis van de schadebehandelaar
Reguliere analyses, rapportages en controles
16. 16
Toch bevat een schadedatabase waardevolle
voorspellende kennis die nu niet wordt gebruikt
Extra mogelijkheden
Voorspellende kennis real-time beschikbaar
krijgen, zonder ICT ‘stress’
Het in de analyse meenemen van ALLE
variabelen (velden) die een relatie hebben
met prijs én prijscomponenten
Pro-actief optimaliseren op een reguliere basis
20. 20
Tot slot
Data Analyse
Zet inzichten op basis van huidige data om naar toekomstige
voorspellingen
Heeft toegevoegde waarde
Is niet zaligmakend
Maar kan ook gevaarlijk zijn in de handen van onkundigen en
leken.