SlideShare ist ein Scribd-Unternehmen logo
1 von 9
Downloaden Sie, um offline zu lesen
Marketing Intelligence
voor Managers –
Het Data Science Proces
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 2
Deze blog is onderdeel van de themareeks ‘Management & BI’. De themareeks is bedoeld voor
managers die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in
begrijpelijke taal en zonder alle technische termen en hypes.
Wat voor activiteiten gaat de data scientist - zoals ik die vorige week heb beschreven - nu eigenlijk
uitvoeren? Welke proces wordt er typisch binnen data science uitgevoerd?
Deze blog gaat eens wat dieper in op het data science proces, zodat je daar een beeld van kunt
vormen.
Introductie
Data science is voor een groot deel een ‘trial and error’ proces, omdat je van tevoren gewoonweg
niet alles kunt voorzien. Het lukt misschien niet om meteen de juiste data te vinden en als je data
vindt kan het zijn dat deze bijna onbruikbaar is door vervuiling. Bij het zoeken naar verbanden of
structuren is het mogelijk dat je wel tientallen modellen moet onderzoeken om er uiteindelijk één te
vinden die het beste aansluit bij jouw data (en vraagstelling). Misschien blijkt het dat je
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 3
algoritmes nodig hebt die nog niet bestaan. Die moet je dan eerst samenstellen uit allerlei
informatie die je bij Stack Overflow of Rbloggers inwint.
Ook al is het proces zo onvoorspelbaar en zullen er onvermijdelijk fouten gemaakt worden die
leervermogen en volharding vereisen, uiteindelijk zijn er wel een aantal distincte activiteiten te
onderkennen.
Stap 1. Van vraag naar onderzoeksmodel
De data scientist start altijd met het opzetten van een onderzoeksmodel. De gestelde vraag moet
worden vertaald naar een model waarin de gebruikte concepten en onderzoeksvragen goed zijn
gedefinieerd. Hieruit leid je door operationalisatie de afhankelijke en onafhankelijke variabelen en
hypotheses af. Deze stap verhoogt de mate waarin het onderzoek controleerbaar en herhaalbaar is.
Het blijft immers science.
Stap 2. Van raw data naar tidy data
De in het onderzoeksmodel bepaalde variabelen helpen de data scientist beslissen welke data hij
nodig gaat hebben tijdens zijn onderzoek. Met die kennis gaat hij op zoek naar die data, want die
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 4
kan in principe overal vandaan komen. Denk bijvoorbeeld naast interne bronnen ook aan data van
externe partijen zoals Twitter, Facebook, LinkedIn, Webpages, enzovoorts. Daarover lees je meer in
de volgende blog.
Veel werk gaat zitten in het verkrijgen en schoonmaken van data. Vaak is de data die de data
scientist binnenhaalt in ruwe vorm opgeslagen (raw data). Dat kan bijvoorbeeld data uit het
’scrapen’ van een webpage zijn. Hij moet die raw data dan nog op allerlei manieren bewerken om
er nette R-objecten van te maken (tidy data) voordat hij ermee kan gaan werken.
Zonder er formeel dieper op in te gaan - maar om een beetje gevoel te krijgen voor wat ‘tidy’ is -
geef ik hieronder de vaak gehanteerde criteria:
• Elke variabele heeft zijn eigen kolom in de data tabel.
• Elke verschillende observatie moet in een verschillende rij staan.
• Er is één data tabel voor één soort variabele.
• Als er meerdere data tabellen zijn, moeten ze onderling koppelbaar zijn middels een sleutelkolom.
De uitleg van de precieze bedoeling van deze criteria strekt een beetje te ver voor deze blog, maar
ben je geïnteresseerd dan kan ik je deze paper (PDF) van Hadley Wickham aanraden.
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 5
Tidy data is een noodzakelijke voorwaarde voor het starten met het inhoudelijk onderzoeken van
die data. Het proces van raw data naar tidy data moet goed gestructureerd plaatsvinden. Data
scientists gebruiken daar vaak een ‘code book’ voor. Daarin staat bijvoorbeeld:
• Het onderzoeksmodel waarin naast een beschrijving van (de reden voor) het onderzoek, ook staat
aangegeven hoe je de ruwe data hebt gevonden en binnengehaald.
• De data beschrijving (een sectie die soms zelf weer code book wordt genoemd), met daarin een
beschrijving van alle variabelen en eenheden die gebruikt worden, zowel voor de tidy data als
voor de variabelen die niet in de tidy data terecht zijn gekomen.
• Een recept dat aangeeft welke bewerking de data scientist heeft gebruikt om van de raw data,
tidy data te maken, inclusief handmatige stappen en eventuele R- of Python-scripts.
Met behulp van dit codebook zou elke willekeurige data scientist, uit de ruwe data, precies dezelfde
tidy data moeten kunnen genereren. Zie hier de opnieuw de herhaalbaarheid en controleerbaarheid
van ‘science’. Dat dat zinvol is blijkt bijvoorbeeld uit
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 6
Stap 3: Exploratieve Data Analyse
De data scientist zal de uiteindelijk voorbereide tidy data eerst gaan onderzoeken met exploratieve
data analyse. Hiermee kan hij de waarde van de data voor het onderzoek vaststellen. Ook deze
stap kent allerlei statistische analyses. Het kan zijn dat de data scientist toch weer op zoek moet
naar nieuwe, betere databronnen en dus de vorige stap herhaald moet uitvoeren. Maar dat is
allemaal onderdeel van de ‘trial and error’ aanpak binnen het strak omlijnde onderzoeksmodel. Ook
hier zie je de volhardendheid van de data scientist terugkomen.
Stap 4. Het onderzoek uitvoeren
Uiteindelijk heeft de data scientist de juiste tidy data en kan het werkelijke onderzoek zoals gesteld
in het onderzoeksmodel beginnen. Het uitvoeren van het ten principale reproduceerbare onderzoek,
behelst zaken als statistical inference, regressiemodellen, machine learning en het ontwikkelen van
data producten. Alles om de hypotheses in het model te onderzoeken. In principe kunnen uit dit
onderzoek weer redenen ontstaan om terug te keren naar nieuwe of betere databronnen en dus de
iteratie van voorgaande stappen, waarbij het codebook natuurlijk navenant wordt bijgewerkt.
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 7
Vaak is het zo dat allerlei modellen en algoritmes experimenteel worden toegepast en weer
verworpen voor nieuwe modellen. Dat is een repeterend proces totdat de juiste, best aansluitende
modellen bepaald zijn, waardoor de data scientist tot een sluitend, betekenisvol
onderzoeksresultaat kan komen. Ook hier is vindingrijkheid en volhardendheid een vereiste.
Stap 5. Resultaten presenteren
Het presenteren van de onderzoeksresultaten kan in allerlei vormen. Veelal zullen hierbij ‘plots’
gebruikt worden, grafieken die de gevonden correlatie of regressie duidelijk zichtbaar maken.
Inhoudelijk gezien worden hypotheses verworpen of geaccepteerd. Voor marketing betekent dit
bijvoorbeeld dat aangetoond wordt welke variabelen een invloed uitoefenen op bijvoorbeeld
koopgedrag of churn. Uit die constateringen kunnen dan weer voorspellende modellen worden
afgeleid, die weer gebruikt kunnen worden voor campagnes of voor NBA-engines.
Belangrijk is dat je begrijpt dat elke simulatie maar een simulatie is en dat dergelijke voorspellende
modellen op basis van de werkelijke resultaten moeten worden bijgesteld om tot goede resultaten
te komen.
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 8
Marketing en het data science proces
De marketing discipline zit vaak verlegen om antwoorden op allerlei vragen. Soms kunnen deze
vragen op een goede manier door data science worden geadresseerd. Het data science proces
wordt vrijwel altijd buiten het marketing productieproces geplaatst als een soort research
laboratorium. Dit voor het vinden van voorspellende modellen met bruikbare, onafhankelijke
variabelen die afhankelijke variabelen in voldoende mate verklaren. Zo kan marketing erachter
komen dat mannen met snorren en baarden meer bier drinken. Of dat 60% van de bezoekers die
de blog rond de OLED-technologie uit eigener beweging kiezen en langer dan 30 seconden lezen, de
nieuwe TV van Samsung binnen 30 dagen aanschaffen als ze tussen de 20 en 25 jaar zijn.
Welk klantgedrag voorspelt een aankoop? Welke bezoekerseigenschappen zijn bepalend voor het
kiezen van een nurture path voor een bepaalde bezoeker? Laat je data science lab het eens
uitzoeken.
De data science reeks
Na deze blog over het proces van marketing data science, zal ik in de komende blog eens wat
dieper in de databronnen voor data science duiken.
Marketing Intelligence voor Managers – Het Data Science Proces
Pg, 9
Ben je nieuwsgierig naar de komende blogs over Marketing Intelligence? Abonneer je via
onderstaande knop dan op het thema ‘Management & BI’. Zodra er een nieuwe blog in de reeks
verschijnt, krijg je automatisch een seintje (per e-mail) met een link.
Laat hier een opmerking achter als je een bepaald onderwerp rond Marketing Intelligence wilt
aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog binnen
de reeks wordt besproken.

Weitere ähnliche Inhalte

Andere mochten auch

Trabajo%20 presentacion%20diana[1]
Trabajo%20 presentacion%20diana[1]Trabajo%20 presentacion%20diana[1]
Trabajo%20 presentacion%20diana[1]CANCER1979
 
Multiple choice
Multiple choiceMultiple choice
Multiple choicemoncars
 
Verbale incontro mp 10 ottobre 2012
Verbale incontro mp   10 ottobre 2012Verbale incontro mp   10 ottobre 2012
Verbale incontro mp 10 ottobre 2012Fabio Bolo
 
Superliving Dr. Shriniwas Kashalikar
Superliving Dr. Shriniwas KashalikarSuperliving Dr. Shriniwas Kashalikar
Superliving Dr. Shriniwas Kashalikarsangh1212
 
Freedom Dr. Shriniwas Kashalikar
Freedom Dr. Shriniwas KashalikarFreedom Dr. Shriniwas Kashalikar
Freedom Dr. Shriniwas Kashalikarsangh1212
 
Bando contributo per_handicap_grave-e-grave_malattia
Bando contributo per_handicap_grave-e-grave_malattiaBando contributo per_handicap_grave-e-grave_malattia
Bando contributo per_handicap_grave-e-grave_malattiaFabio Bolo
 
Outdoor Campaigns - May
Outdoor Campaigns - MayOutdoor Campaigns - May
Outdoor Campaigns - Mayexhibitmag
 
H O W T O L I V E I N H A R M O N Y D R S H R I N I W A S K A S H A L ...
H O W  T O  L I V E  I N  H A R M O N Y  D R  S H R I N I W A S  K A S H A L ...H O W  T O  L I V E  I N  H A R M O N Y  D R  S H R I N I W A S  K A S H A L ...
H O W T O L I V E I N H A R M O N Y D R S H R I N I W A S K A S H A L ...sangh1212
 
Comunicato incontro del 19 dicembre su art .70 ccnl
Comunicato incontro del 19 dicembre su art .70 ccnlComunicato incontro del 19 dicembre su art .70 ccnl
Comunicato incontro del 19 dicembre su art .70 ccnlFabio Bolo
 
Oo.ss cisl per inesitate
Oo.ss cisl per inesitateOo.ss cisl per inesitate
Oo.ss cisl per inesitateFabio Bolo
 
Comunicato stampa mancato pagamento stipendi
Comunicato stampa mancato pagamento stipendiComunicato stampa mancato pagamento stipendi
Comunicato stampa mancato pagamento stipendiFabio Bolo
 
Apresentacao Boulevard Monde SET 2015
Apresentacao Boulevard Monde SET 2015Apresentacao Boulevard Monde SET 2015
Apresentacao Boulevard Monde SET 2015Tiago Daniel NEXT21
 
Material MDM in the Oil & Gas Industry - A Verdantis Case Study
Material MDM in the Oil & Gas Industry - A Verdantis Case StudyMaterial MDM in the Oil & Gas Industry - A Verdantis Case Study
Material MDM in the Oil & Gas Industry - A Verdantis Case StudyVipul Aroh
 
Bright Pebbles: So Much Love
Bright Pebbles: So Much LoveBright Pebbles: So Much Love
Bright Pebbles: So Much LoveMyWonderStudio
 

Andere mochten auch (17)

Trabajo%20 presentacion%20diana[1]
Trabajo%20 presentacion%20diana[1]Trabajo%20 presentacion%20diana[1]
Trabajo%20 presentacion%20diana[1]
 
Multiple choice
Multiple choiceMultiple choice
Multiple choice
 
Verbale incontro mp 10 ottobre 2012
Verbale incontro mp   10 ottobre 2012Verbale incontro mp   10 ottobre 2012
Verbale incontro mp 10 ottobre 2012
 
Superliving Dr. Shriniwas Kashalikar
Superliving Dr. Shriniwas KashalikarSuperliving Dr. Shriniwas Kashalikar
Superliving Dr. Shriniwas Kashalikar
 
Závěrečný úkol KPI
Závěrečný úkol KPIZávěrečný úkol KPI
Závěrečný úkol KPI
 
Peter pr143 1_061
Peter pr143 1_061Peter pr143 1_061
Peter pr143 1_061
 
Freedom Dr. Shriniwas Kashalikar
Freedom Dr. Shriniwas KashalikarFreedom Dr. Shriniwas Kashalikar
Freedom Dr. Shriniwas Kashalikar
 
Bando contributo per_handicap_grave-e-grave_malattia
Bando contributo per_handicap_grave-e-grave_malattiaBando contributo per_handicap_grave-e-grave_malattia
Bando contributo per_handicap_grave-e-grave_malattia
 
Outdoor Campaigns - May
Outdoor Campaigns - MayOutdoor Campaigns - May
Outdoor Campaigns - May
 
H O W T O L I V E I N H A R M O N Y D R S H R I N I W A S K A S H A L ...
H O W  T O  L I V E  I N  H A R M O N Y  D R  S H R I N I W A S  K A S H A L ...H O W  T O  L I V E  I N  H A R M O N Y  D R  S H R I N I W A S  K A S H A L ...
H O W T O L I V E I N H A R M O N Y D R S H R I N I W A S K A S H A L ...
 
Comunicato incontro del 19 dicembre su art .70 ccnl
Comunicato incontro del 19 dicembre su art .70 ccnlComunicato incontro del 19 dicembre su art .70 ccnl
Comunicato incontro del 19 dicembre su art .70 ccnl
 
Oo.ss cisl per inesitate
Oo.ss cisl per inesitateOo.ss cisl per inesitate
Oo.ss cisl per inesitate
 
Comunicato stampa mancato pagamento stipendi
Comunicato stampa mancato pagamento stipendiComunicato stampa mancato pagamento stipendi
Comunicato stampa mancato pagamento stipendi
 
Apresentacao Boulevard Monde SET 2015
Apresentacao Boulevard Monde SET 2015Apresentacao Boulevard Monde SET 2015
Apresentacao Boulevard Monde SET 2015
 
Material MDM in the Oil & Gas Industry - A Verdantis Case Study
Material MDM in the Oil & Gas Industry - A Verdantis Case StudyMaterial MDM in the Oil & Gas Industry - A Verdantis Case Study
Material MDM in the Oil & Gas Industry - A Verdantis Case Study
 
16 solomon
16 solomon16 solomon
16 solomon
 
Bright Pebbles: So Much Love
Bright Pebbles: So Much LoveBright Pebbles: So Much Love
Bright Pebbles: So Much Love
 

Ähnlich wie Marketing intelligence voor managers – data science proces

Marketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroMarketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroFourPoints Business Intelligence
 
Marketing Intelligence voor Managers – Stappenplan voor toolkeuze
Marketing Intelligence voor Managers – Stappenplan voor toolkeuzeMarketing Intelligence voor Managers – Stappenplan voor toolkeuze
Marketing Intelligence voor Managers – Stappenplan voor toolkeuzeFourPoints Business Intelligence
 
FB_24-31_Ronald Damhof
FB_24-31_Ronald DamhofFB_24-31_Ronald Damhof
FB_24-31_Ronald DamhofPrudenza B.V
 
NL - Module 3- Using external Data
NL - Module 3- Using external Data NL - Module 3- Using external Data
NL - Module 3- Using external Data caniceconsulting
 
Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...
Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...
Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...SURF Events
 
Business Intelligence voor managers: Need-to-know #5 Datastructuur
Business Intelligence voor managers: Need-to-know #5 Datastructuur Business Intelligence voor managers: Need-to-know #5 Datastructuur
Business Intelligence voor managers: Need-to-know #5 Datastructuur FourPoints Business Intelligence
 
Presentatie Analistenmiddag Ambulancezorg 2021
Presentatie Analistenmiddag Ambulancezorg 2021Presentatie Analistenmiddag Ambulancezorg 2021
Presentatie Analistenmiddag Ambulancezorg 2021Tom Berger
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)FourPoints Business Intelligence
 
Presentatie 2e roundtable ai and audit 2018 coney
Presentatie 2e roundtable ai and audit 2018 coneyPresentatie 2e roundtable ai and audit 2018 coney
Presentatie 2e roundtable ai and audit 2018 coneydrs Pieter de Kok RA
 
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)FourPoints Business Intelligence
 
Master data: een must voor iedere organisatie
Master data: een must voor iedere organisatieMaster data: een must voor iedere organisatie
Master data: een must voor iedere organisatieitelligence Nederland
 
Marketing intelligence voor managers – big data voor mkb
Marketing intelligence voor managers – big data voor mkbMarketing intelligence voor managers – big data voor mkb
Marketing intelligence voor managers – big data voor mkbFourPoints Business Intelligence
 
NL - Module 2 - Using your own Data
NL - Module 2 - Using your own DataNL - Module 2 - Using your own Data
NL - Module 2 - Using your own Datacaniceconsulting
 
Presentatie Knowledge Graphs
Presentatie Knowledge Graphs Presentatie Knowledge Graphs
Presentatie Knowledge Graphs EloseSioen
 
marketing intelligence voor managers – wat is big data? en moeten we er inmid...
marketing intelligence voor managers – wat is big data? en moeten we er inmid...marketing intelligence voor managers – wat is big data? en moeten we er inmid...
marketing intelligence voor managers – wat is big data? en moeten we er inmid...FourPoints Business Intelligence
 
Manpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategie
Manpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategieManpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategie
Manpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategieBigDataExpo
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA
 

Ähnlich wie Marketing intelligence voor managers – data science proces (20)

Marketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroMarketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - Intro
 
Marketing Intelligence voor Managers – Stappenplan voor toolkeuze
Marketing Intelligence voor Managers – Stappenplan voor toolkeuzeMarketing Intelligence voor Managers – Stappenplan voor toolkeuze
Marketing Intelligence voor Managers – Stappenplan voor toolkeuze
 
FB_24-31_Ronald Damhof
FB_24-31_Ronald DamhofFB_24-31_Ronald Damhof
FB_24-31_Ronald Damhof
 
NL - Module 3- Using external Data
NL - Module 3- Using external Data NL - Module 3- Using external Data
NL - Module 3- Using external Data
 
Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...
Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...
Waarden ethiek en ai in het onderwijs, deel 2 - Wilco Te Winkel (EUR), Arun R...
 
Business Intelligence voor managers: Need-to-know #5 Datastructuur
Business Intelligence voor managers: Need-to-know #5 Datastructuur Business Intelligence voor managers: Need-to-know #5 Datastructuur
Business Intelligence voor managers: Need-to-know #5 Datastructuur
 
Presentatie Analistenmiddag Ambulancezorg 2021
Presentatie Analistenmiddag Ambulancezorg 2021Presentatie Analistenmiddag Ambulancezorg 2021
Presentatie Analistenmiddag Ambulancezorg 2021
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)
 
Presentatie 2e roundtable ai and audit 2018 coney
Presentatie 2e roundtable ai and audit 2018 coneyPresentatie 2e roundtable ai and audit 2018 coney
Presentatie 2e roundtable ai and audit 2018 coney
 
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
 
Master data: een must voor iedere organisatie
Master data: een must voor iedere organisatieMaster data: een must voor iedere organisatie
Master data: een must voor iedere organisatie
 
Marketing intelligence voor managers – big data voor mkb
Marketing intelligence voor managers – big data voor mkbMarketing intelligence voor managers – big data voor mkb
Marketing intelligence voor managers – big data voor mkb
 
NL - Module 2 - Using your own Data
NL - Module 2 - Using your own DataNL - Module 2 - Using your own Data
NL - Module 2 - Using your own Data
 
Presentatie Knowledge Graphs
Presentatie Knowledge Graphs Presentatie Knowledge Graphs
Presentatie Knowledge Graphs
 
Marketing Intelligence voor Managers - Zinvolle Big Data
Marketing Intelligence voor Managers - Zinvolle Big DataMarketing Intelligence voor Managers - Zinvolle Big Data
Marketing Intelligence voor Managers - Zinvolle Big Data
 
Hoe zet je een goede datastrategie op? - What's next in... Data, Analytics & ...
Hoe zet je een goede datastrategie op? - What's next in... Data, Analytics & ...Hoe zet je een goede datastrategie op? - What's next in... Data, Analytics & ...
Hoe zet je een goede datastrategie op? - What's next in... Data, Analytics & ...
 
marketing intelligence voor managers – wat is big data? en moeten we er inmid...
marketing intelligence voor managers – wat is big data? en moeten we er inmid...marketing intelligence voor managers – wat is big data? en moeten we er inmid...
marketing intelligence voor managers – wat is big data? en moeten we er inmid...
 
11. Wat is Big Data? En moeten we er wat mee?
11. Wat is Big Data? En moeten we er wat mee?11. Wat is Big Data? En moeten we er wat mee?
11. Wat is Big Data? En moeten we er wat mee?
 
Manpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategie
Manpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategieManpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategie
Manpower - Best-practices: de vernieuwingsslag naar een data-gedreven strategie
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data Governance
 

Mehr von FourPoints Business Intelligence

De Definition of Done: essentieel voor verwachtingsmanagement
De Definition of Done: essentieel voor verwachtingsmanagement De Definition of Done: essentieel voor verwachtingsmanagement
De Definition of Done: essentieel voor verwachtingsmanagement FourPoints Business Intelligence
 
Marketing Intelligence voor Managers – Marketing Automation Tools
Marketing Intelligence voor Managers – Marketing Automation ToolsMarketing Intelligence voor Managers – Marketing Automation Tools
Marketing Intelligence voor Managers – Marketing Automation ToolsFourPoints Business Intelligence
 
Marketing intelligence voor managers – de marketing cyclus
Marketing intelligence voor managers – de marketing cyclusMarketing intelligence voor managers – de marketing cyclus
Marketing intelligence voor managers – de marketing cyclusFourPoints Business Intelligence
 
Marketing Intelligence voor Managers – Customer Data voor MKB
 Marketing Intelligence  voor Managers – Customer Data voor MKB Marketing Intelligence  voor Managers – Customer Data voor MKB
Marketing Intelligence voor Managers – Customer Data voor MKBFourPoints Business Intelligence
 
Marketing Intelligence voor Managers – Inbound Marketing voor MKB
Marketing Intelligence voor Managers – Inbound Marketing voor MKBMarketing Intelligence voor Managers – Inbound Marketing voor MKB
Marketing Intelligence voor Managers – Inbound Marketing voor MKBFourPoints Business Intelligence
 
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?FourPoints Business Intelligence
 
Marketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
Marketing Intelligence voor Managers – Kanalen, Verkoop en MarketingMarketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
Marketing Intelligence voor Managers – Kanalen, Verkoop en MarketingFourPoints Business Intelligence
 
Marketing Intelligence voor Managers – Standaardmodel klantcontact
Marketing Intelligence voor Managers – Standaardmodel klantcontactMarketing Intelligence voor Managers – Standaardmodel klantcontact
Marketing Intelligence voor Managers – Standaardmodel klantcontactFourPoints Business Intelligence
 
Marketing Intelligence voor Managers – 5 uitdagingen voor Marketing
Marketing Intelligence voor Managers – 5 uitdagingen voor MarketingMarketing Intelligence voor Managers – 5 uitdagingen voor Marketing
Marketing Intelligence voor Managers – 5 uitdagingen voor MarketingFourPoints Business Intelligence
 
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)FourPoints Business Intelligence
 
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal Dwh
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal DwhDe 8 BI-groeisignalen voor managers - Situatie 7: het Centraal Dwh
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal DwhFourPoints Business Intelligence
 
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-tools
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-toolsDe 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-tools
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-toolsFourPoints Business Intelligence
 
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouse
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouseDe 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouse
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouseFourPoints Business Intelligence
 
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-serverDe 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-serverFourPoints Business Intelligence
 
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...FourPoints Business Intelligence
 

Mehr von FourPoints Business Intelligence (18)

De Definition of Done: essentieel voor verwachtingsmanagement
De Definition of Done: essentieel voor verwachtingsmanagement De Definition of Done: essentieel voor verwachtingsmanagement
De Definition of Done: essentieel voor verwachtingsmanagement
 
BI architectuur - business versus enterprise
BI architectuur -  business versus enterpriseBI architectuur -  business versus enterprise
BI architectuur - business versus enterprise
 
Marketing Intelligence voor Managers – Marketing Automation Tools
Marketing Intelligence voor Managers – Marketing Automation ToolsMarketing Intelligence voor Managers – Marketing Automation Tools
Marketing Intelligence voor Managers – Marketing Automation Tools
 
Marketing intelligence voor managers – de marketing cyclus
Marketing intelligence voor managers – de marketing cyclusMarketing intelligence voor managers – de marketing cyclus
Marketing intelligence voor managers – de marketing cyclus
 
Marketing Intelligence voor Managers – Customer Data voor MKB
 Marketing Intelligence  voor Managers – Customer Data voor MKB Marketing Intelligence  voor Managers – Customer Data voor MKB
Marketing Intelligence voor Managers – Customer Data voor MKB
 
Marketing Intelligence voor Managers – Inbound Marketing voor MKB
Marketing Intelligence voor Managers – Inbound Marketing voor MKBMarketing Intelligence voor Managers – Inbound Marketing voor MKB
Marketing Intelligence voor Managers – Inbound Marketing voor MKB
 
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
 
Marketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
Marketing Intelligence voor Managers – Kanalen, Verkoop en MarketingMarketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
Marketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
 
Marketing Intelligence voor Managers – Standaardmodel klantcontact
Marketing Intelligence voor Managers – Standaardmodel klantcontactMarketing Intelligence voor Managers – Standaardmodel klantcontact
Marketing Intelligence voor Managers – Standaardmodel klantcontact
 
Marketing Intelligence voor Managers – 5 uitdagingen voor Marketing
Marketing Intelligence voor Managers – 5 uitdagingen voor MarketingMarketing Intelligence voor Managers – 5 uitdagingen voor Marketing
Marketing Intelligence voor Managers – 5 uitdagingen voor Marketing
 
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)
 
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal Dwh
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal DwhDe 8 BI-groeisignalen voor managers - Situatie 7: het Centraal Dwh
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal Dwh
 
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-tools
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-toolsDe 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-tools
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-tools
 
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouse
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouseDe 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouse
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouse
 
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-serverDe 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
 
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...
 
Business Intelligence, niet alleen voor de groten
Business Intelligence, niet alleen voor de grotenBusiness Intelligence, niet alleen voor de groten
Business Intelligence, niet alleen voor de groten
 
BI Tooltip: Qlikview in high-performance omgevingen
BI Tooltip: Qlikview in high-performance omgevingenBI Tooltip: Qlikview in high-performance omgevingen
BI Tooltip: Qlikview in high-performance omgevingen
 

Marketing intelligence voor managers – data science proces

  • 1. Marketing Intelligence voor Managers – Het Data Science Proces
  • 2. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 2 Deze blog is onderdeel van de themareeks ‘Management & BI’. De themareeks is bedoeld voor managers die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in begrijpelijke taal en zonder alle technische termen en hypes. Wat voor activiteiten gaat de data scientist - zoals ik die vorige week heb beschreven - nu eigenlijk uitvoeren? Welke proces wordt er typisch binnen data science uitgevoerd? Deze blog gaat eens wat dieper in op het data science proces, zodat je daar een beeld van kunt vormen. Introductie Data science is voor een groot deel een ‘trial and error’ proces, omdat je van tevoren gewoonweg niet alles kunt voorzien. Het lukt misschien niet om meteen de juiste data te vinden en als je data vindt kan het zijn dat deze bijna onbruikbaar is door vervuiling. Bij het zoeken naar verbanden of structuren is het mogelijk dat je wel tientallen modellen moet onderzoeken om er uiteindelijk één te vinden die het beste aansluit bij jouw data (en vraagstelling). Misschien blijkt het dat je
  • 3. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 3 algoritmes nodig hebt die nog niet bestaan. Die moet je dan eerst samenstellen uit allerlei informatie die je bij Stack Overflow of Rbloggers inwint. Ook al is het proces zo onvoorspelbaar en zullen er onvermijdelijk fouten gemaakt worden die leervermogen en volharding vereisen, uiteindelijk zijn er wel een aantal distincte activiteiten te onderkennen. Stap 1. Van vraag naar onderzoeksmodel De data scientist start altijd met het opzetten van een onderzoeksmodel. De gestelde vraag moet worden vertaald naar een model waarin de gebruikte concepten en onderzoeksvragen goed zijn gedefinieerd. Hieruit leid je door operationalisatie de afhankelijke en onafhankelijke variabelen en hypotheses af. Deze stap verhoogt de mate waarin het onderzoek controleerbaar en herhaalbaar is. Het blijft immers science. Stap 2. Van raw data naar tidy data De in het onderzoeksmodel bepaalde variabelen helpen de data scientist beslissen welke data hij nodig gaat hebben tijdens zijn onderzoek. Met die kennis gaat hij op zoek naar die data, want die
  • 4. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 4 kan in principe overal vandaan komen. Denk bijvoorbeeld naast interne bronnen ook aan data van externe partijen zoals Twitter, Facebook, LinkedIn, Webpages, enzovoorts. Daarover lees je meer in de volgende blog. Veel werk gaat zitten in het verkrijgen en schoonmaken van data. Vaak is de data die de data scientist binnenhaalt in ruwe vorm opgeslagen (raw data). Dat kan bijvoorbeeld data uit het ’scrapen’ van een webpage zijn. Hij moet die raw data dan nog op allerlei manieren bewerken om er nette R-objecten van te maken (tidy data) voordat hij ermee kan gaan werken. Zonder er formeel dieper op in te gaan - maar om een beetje gevoel te krijgen voor wat ‘tidy’ is - geef ik hieronder de vaak gehanteerde criteria: • Elke variabele heeft zijn eigen kolom in de data tabel. • Elke verschillende observatie moet in een verschillende rij staan. • Er is één data tabel voor één soort variabele. • Als er meerdere data tabellen zijn, moeten ze onderling koppelbaar zijn middels een sleutelkolom. De uitleg van de precieze bedoeling van deze criteria strekt een beetje te ver voor deze blog, maar ben je geïnteresseerd dan kan ik je deze paper (PDF) van Hadley Wickham aanraden.
  • 5. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 5 Tidy data is een noodzakelijke voorwaarde voor het starten met het inhoudelijk onderzoeken van die data. Het proces van raw data naar tidy data moet goed gestructureerd plaatsvinden. Data scientists gebruiken daar vaak een ‘code book’ voor. Daarin staat bijvoorbeeld: • Het onderzoeksmodel waarin naast een beschrijving van (de reden voor) het onderzoek, ook staat aangegeven hoe je de ruwe data hebt gevonden en binnengehaald. • De data beschrijving (een sectie die soms zelf weer code book wordt genoemd), met daarin een beschrijving van alle variabelen en eenheden die gebruikt worden, zowel voor de tidy data als voor de variabelen die niet in de tidy data terecht zijn gekomen. • Een recept dat aangeeft welke bewerking de data scientist heeft gebruikt om van de raw data, tidy data te maken, inclusief handmatige stappen en eventuele R- of Python-scripts. Met behulp van dit codebook zou elke willekeurige data scientist, uit de ruwe data, precies dezelfde tidy data moeten kunnen genereren. Zie hier de opnieuw de herhaalbaarheid en controleerbaarheid van ‘science’. Dat dat zinvol is blijkt bijvoorbeeld uit
  • 6. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 6 Stap 3: Exploratieve Data Analyse De data scientist zal de uiteindelijk voorbereide tidy data eerst gaan onderzoeken met exploratieve data analyse. Hiermee kan hij de waarde van de data voor het onderzoek vaststellen. Ook deze stap kent allerlei statistische analyses. Het kan zijn dat de data scientist toch weer op zoek moet naar nieuwe, betere databronnen en dus de vorige stap herhaald moet uitvoeren. Maar dat is allemaal onderdeel van de ‘trial and error’ aanpak binnen het strak omlijnde onderzoeksmodel. Ook hier zie je de volhardendheid van de data scientist terugkomen. Stap 4. Het onderzoek uitvoeren Uiteindelijk heeft de data scientist de juiste tidy data en kan het werkelijke onderzoek zoals gesteld in het onderzoeksmodel beginnen. Het uitvoeren van het ten principale reproduceerbare onderzoek, behelst zaken als statistical inference, regressiemodellen, machine learning en het ontwikkelen van data producten. Alles om de hypotheses in het model te onderzoeken. In principe kunnen uit dit onderzoek weer redenen ontstaan om terug te keren naar nieuwe of betere databronnen en dus de iteratie van voorgaande stappen, waarbij het codebook natuurlijk navenant wordt bijgewerkt.
  • 7. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 7 Vaak is het zo dat allerlei modellen en algoritmes experimenteel worden toegepast en weer verworpen voor nieuwe modellen. Dat is een repeterend proces totdat de juiste, best aansluitende modellen bepaald zijn, waardoor de data scientist tot een sluitend, betekenisvol onderzoeksresultaat kan komen. Ook hier is vindingrijkheid en volhardendheid een vereiste. Stap 5. Resultaten presenteren Het presenteren van de onderzoeksresultaten kan in allerlei vormen. Veelal zullen hierbij ‘plots’ gebruikt worden, grafieken die de gevonden correlatie of regressie duidelijk zichtbaar maken. Inhoudelijk gezien worden hypotheses verworpen of geaccepteerd. Voor marketing betekent dit bijvoorbeeld dat aangetoond wordt welke variabelen een invloed uitoefenen op bijvoorbeeld koopgedrag of churn. Uit die constateringen kunnen dan weer voorspellende modellen worden afgeleid, die weer gebruikt kunnen worden voor campagnes of voor NBA-engines. Belangrijk is dat je begrijpt dat elke simulatie maar een simulatie is en dat dergelijke voorspellende modellen op basis van de werkelijke resultaten moeten worden bijgesteld om tot goede resultaten te komen.
  • 8. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 8 Marketing en het data science proces De marketing discipline zit vaak verlegen om antwoorden op allerlei vragen. Soms kunnen deze vragen op een goede manier door data science worden geadresseerd. Het data science proces wordt vrijwel altijd buiten het marketing productieproces geplaatst als een soort research laboratorium. Dit voor het vinden van voorspellende modellen met bruikbare, onafhankelijke variabelen die afhankelijke variabelen in voldoende mate verklaren. Zo kan marketing erachter komen dat mannen met snorren en baarden meer bier drinken. Of dat 60% van de bezoekers die de blog rond de OLED-technologie uit eigener beweging kiezen en langer dan 30 seconden lezen, de nieuwe TV van Samsung binnen 30 dagen aanschaffen als ze tussen de 20 en 25 jaar zijn. Welk klantgedrag voorspelt een aankoop? Welke bezoekerseigenschappen zijn bepalend voor het kiezen van een nurture path voor een bepaalde bezoeker? Laat je data science lab het eens uitzoeken. De data science reeks Na deze blog over het proces van marketing data science, zal ik in de komende blog eens wat dieper in de databronnen voor data science duiken.
  • 9. Marketing Intelligence voor Managers – Het Data Science Proces Pg, 9 Ben je nieuwsgierig naar de komende blogs over Marketing Intelligence? Abonneer je via onderstaande knop dan op het thema ‘Management & BI’. Zodra er een nieuwe blog in de reeks verschijnt, krijg je automatisch een seintje (per e-mail) met een link. Laat hier een opmerking achter als je een bepaald onderwerp rond Marketing Intelligence wilt aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog binnen de reeks wordt besproken.