Bij OTTO vormt data science hét fundament voor alle marketingbeslissingen. Om haar klanten beter te begrijpen en te voorzien van een persoonlijk relevant aanbod, begint elke procesverbetering met data-analyse. Dirk neemt je mee in OTTO’s data science visie en zal middels concrete cases uitleggen hoe deze in praktijk wordt gebracht.
2. Dirk Verzijden
4 years at OTTO:
Started as business analyst
Set up BI project team
Business owner Lascana NL
Lead SEA OTTO NL
Business Intelligence
3. Duy Ha Ly
1 year at OTTO:
Data Scientist in BI team
Product owner of Google 360 Suite
Responsible for OTTO experimentation
platform
Responsible for data science projects
from marketing to finance
Data Science
4. Agenda
Introduction OTTO
BI and Data Science landscape at OTTO
Two use cases
The future: An offer you can’t refuse
5. Agenda
Introduction OTTO
BI and Data Science landscape at OTTO
Two use cases
The future: An offer you can’t refuse
7. OTTO NL total revenue:
€ 120M (online/offline: 80% / 20%)
Focus on service for diverse assortment:
Fashion
Home & Living
Electronics
Focus OTTO upcoming years:
Change of Business Model into Platform Strategy
OTTO group total revenue:
€ 13.7 Billion
Of which online retail:
€ 7.9 Billion (58%)
123 webshops worldwide
* 51,785 employees
Active in 30 countries
Some facts
8. Our commercial strategy:
Maximize revenue with fixed EBT
But how to do this?
Two options:
Branding: More budget in advertisement
Smarter: Spend existing budget better
(with BI and data science)
Some facts
9. Our commercial strategy:
Maximize revenue with fixed EBT
But how to do this?
Two options:
Branding: More budget in
advertisement
Smarter: Spend existing
budget better (with BI and
data science)
The digital marketing game we play every day
10. Our commercial strategy:
Maximize revenue with fixed EBT
But how to do this?
Two options:
Branding: More budget in
advertisement
Smarter: Spend existing
budget better (with BI and
data science)
The digital marketing game we play every day
11. Agenda
Introduction OTTO
BI and Data Science landscape at OTTO
Two use cases
The future: An offer you can’t refuse
12. Some years we outsmarted the market, some years we needed to take measures
2012 2013 2014 2015 2016 2017 2018 2019
Initial plan vs realization
Initial target Realized New measures
Five decisive moments:
2012-2014: 8% steady growth
2015: setback I
2016-2017: focus on data and BI team
End 2017: setback II
2018: start with Data Science
13. Some years we outsmarted the market, some years we needed to take measures
2012 2013 2014 2015 2016 2017 2018 2019
Initial plan vs realization
Initial target Realized New measures
Five decisive moments:
2012-2014: 8% steady growth
2015: setback I
2016-2017: focus on data and BI team
End 2017: setback II
2018: start with Data Science
14. Some years we outsmarted the market, some years we needed to take measures
2012 2013 2014 2015 2016 2017 2018 2019
Initial plan vs realization
Initial target Realized New measures
Five decisive moments:
2012-2014: 8% steady growth
2015: setback I
2016-2017: focus on data and BI team
End 2017: setback II
2018: start with Data Science
15. Some years we outsmarted the market, some years we needed to take measures
2012 2013 2014 2015 2016 2017 2018 2019
Initial plan vs realization
Initial target Realized New measures
Five decisive moments:
2012-2014: 8% steady growth
2015: setback I
2016-2017: focus on data and BI team
End 2017: setback II
2018: start with Data Science
16. Five decisive moments:
2012-2014: 8% steady growth
2015: setback I
2016-2017: focus on data and BI team
End 2017: setback II
2018: start with Data Science
Some years we outsmarted the market, some years we needed to take measures
2012 2013 2014 2015 2016 2017 2018 2019
Initial plan vs realization
Initial target Realized New measures
17. What is the difference?
Business Intelligence
(and DWH):
Descriptive – what happened?
Diagnostive – why did it happen?
Data science
(or ML, AI, PA, BD, …):
Predictive – what will happen?
Prescriptive – what is my best next action?
18. Our current data landscape
BI tooling: DS tooling:
2012 2013 2014 2015 2016 2017 2018 2019
Initial plan vs realization
Initial target Realized New measures
19. Agenda
Introduction OTTO
BI and Data Science landscape at OTTO
Two use cases
The future: An offer you can’t refuse
20. We started with Competitive Pricing and Personal Recommendations
Market potential
Recommendation
(cross-sell opportunities)
Consumer Lifetime ValueCompetitive Pricing
Recommendation
(product website)
Credit scoring
Targeting Timing
Personalized content:
When to show what to who?
Price and personal discount:
How much?
21. Use case: Competitive Pricing (from business perspective)
Personalized content:
When to show what to who?
Price and personal discount:
How much?
Why?
Pricing is very important marketing instrument
Started with one product group: Electronics
Comparable products with competitors
Competitor prices are daily available at kieskeurig.nl
Commercial target:
To increase revenue while keeping EBT fixed
22. Use case: Competitive Pricing (solution design)
INPUT
For all Electronics
products:
Expected sales amount
with new price
Expected profit with new
price
Delta new price with
current price
Expected sales amount
with current price
Expected profit with
current price
New optimal price
suggestion
OUTPUT
Predict
Output:
Expected sales
amount
Expected profit
Input:
Otto price strategy
Competitor’s price
strategies of
tomorrow
Optimize
Two strategies available
per product:
1. Maximize sales (€)
under constraint of
fixed EBT
2. Maximize profit (€)
PRESCRIPTIVEPREDICTIVE
23. Use case: Competitive Pricing (results)
+18%
more traffic
+38%
more visits
+23%
more order value/revenue
+28%
more order value/revenue from
kieskeurig.nl
+4%
more gross profit
EBT remained the same
Reinvestment cycle
24. Personalized content:
When to show what to who?
Price and personal discount:
How much?
Use case: Personal Recommendations (business perspective)
Why?
180K different products at OTTO:
Customer wants relevant content
Started with one product group: Fashion
Biggest impact on commercial strategy
Many behavioral touchpoints (clicks and transactions)
Commercial target:
To increase revenue while keeping EBT fixed
25. Use case: Personal Recommendations (solution design)
A.
User specific
recommendation
B.
Item specific
recommendation
C.
Bestsellers within
product group
Enough data for
recommendation
algorithm?
Yes
Yes
No
No
Customer
known?
Suppose a visitor
enters the website…
26. Use case: Personal Recommendations (results)
+95%
more clicked on
recommendations
in Variant group
+191%
more transactions
in Variant group
27. Data Science + Business knowledge = Success
Always keep the algorithm on the leash!
? ??
30. Agenda
Introduction OTTO
BI and Data Science landscape at OTTO
Two use cases
The future: An offer you can’t refuse
31. But what happens if we combine these solutions?
Recommendation
(cross-sell opportunities)
Competitive Pricing
Recommendation
(product website)
Personalized content:
When to show what to who?
Price and personal discount:
How much?
32. How most recommendation algorithms work…
ProfileID
12345
12345
12345
12345
Recomme-
ndatio rank
1
2
3
4
ProductID
77123
9824
43941
3102
Score
12.3
11.8
1.2
0.9
Algorithms calculate artificial
(not really interpretable)
values to decide what you like most
33. But what if we could estimate the conversion chance,
given that we recommended the product?
ProfileID
12345
12345
12345
12345
Recomme-
ndatio rank
1
2
3
4
ProductID
77123
9824
43941
3102
Score
12.3
11.8
1.2
0.9
Conversion
chance
0.32%
0.31%
0.25%
0.17%
Chance to convert if recommended at
rank 1 (or 2, 3, …)
34. Maybe we should reconsider the ranking..?
ProfileID
12345
12345
12345
12345
Recommen-
ation rank
1
2
3
4
ProductID
77123
9824
43941
3102
Score
12.3
11.8
1.2
0.9
Conversion
chance
0.32%
0.31%
0.25%
0.17%
Price
€ 60
€ 189
€ 89
€ 49
E[Revenue|
recommended at rank 1
to ProfileID = 12345]
E[Revenue]
€ 0.19
€ 0.59
€ 0.22
€ 0.08
A simple maximizing heuristic
can solve this problem easily
Deze is aangepast naar Duy Nog niet mooi verwoord, maar zoiets?
DvdB: Slide helemaal zelfde format gemaakt als Dirk slide
In 1979 is OTTO in Nederland gestart. Wellicht een mooie om hier in de timeline toe te voegen?
DvdB: Misschien dit er bij vertellen? Anders moet ik de hele slide omgooien
60M omzet Demand van OTTO NL = 120M (wellicht iets indrukwekkender cijfer?)
De assortimenten op grote sorteren
Fashion = 64%
Home&Living = 25%
Elektronica = 10%
Mission probeer ik morgen nog even na te vragen bij Eric
DvdB: Done!
Change Coolblue voor Wehkamp (we zijn nog altijd 2/3 een fashion company )
DvdB: Done!
Commercial strategy ‘maximize revenu for a given profit-level (we moeten een bepaald EBT niveau halen vanuit ons moeder bedrijf. Hoe maakt niet uit)
DvdB: Done!
Bij ‘how to do this?’ is het leuk om het punt ‘more’ te veranderen in ‘better’ (addwords schrijf je trouwens als Adwords, een ‘d’) en dan een derde punt toe te voegen ‘Branding’ : more budget in advertisement. Dit punt kan ik dan toelichten dat we dit dus niet mogen doen (dus we moeten onze structuur wel verbeteren om te groeien)
DvdB: Ik wilde juist refereren aan de twee knoppen waar je aan kan draaien:
Meer geld er in pompen op de oude manier
Het budget slimmer besteden (met BI en data science)
Voel je vrij om nog aan te passen naar jullie wens!
De groei mag iets prominenter zijn in de twee tussenliggende jaren (2016/2017). We groeiden met dik 50% ipv 16%. Daarnaast misschien laatste rode stuk een stippellijn maken om aan te geven dat dit de toekomst betreft. Dit moet dan 2018/2019 zijn. Setback II wordt dan 2018
DvdB: Done!
Duy kwam ook nog met een goede toevoeging. Wat cijfers bij de decisive moments. *% eerste twee jaar (as planned). Setback I (-1% - cost saving strategy and building up DWH). 2016-2017 – growth over 50% (restructuring investments) Early 2018 – Not really a setback, but more stagnation of growth. Not getting much more out of restructuring, new measures needed). 2018-2019 Data Science takes over
Misschien zelfs een extra slide wijden aan 2016-2017, om eerste stuk in Data Science stappen ook iets verder toe te lichten. 50% groei met alleen verbetering in structuur is op zich wel indrukwekkend
DvdB: Mannen, voel je vrij om deze slide nog aan te vullen met mooie cijfers
De groei mag iets prominenter zijn in de twee tussenliggende jaren (2016/2017). We groeiden met dik 50% ipv 16%. Daarnaast misschien laatste rode stuk een stippellijn maken om aan te geven dat dit de toekomst betreft. Dit moet dan 2018/2019 zijn. Setback II wordt dan 2018
DvdB: Done!
Duy kwam ook nog met een goede toevoeging. Wat cijfers bij de decisive moments. *% eerste twee jaar (as planned). Setback I (-1% - cost saving strategy and building up DWH). 2016-2017 – growth over 50% (restructuring investments) Early 2018 – Not really a setback, but more stagnation of growth. Not getting much more out of restructuring, new measures needed). 2018-2019 Data Science takes over
Misschien zelfs een extra slide wijden aan 2016-2017, om eerste stuk in Data Science stappen ook iets verder toe te lichten. 50% groei met alleen verbetering in structuur is op zich wel indrukwekkend
DvdB: Mannen, voel je vrij om deze slide nog aan te vullen met mooie cijfers
De groei mag iets prominenter zijn in de twee tussenliggende jaren (2016/2017). We groeiden met dik 50% ipv 16%. Daarnaast misschien laatste rode stuk een stippellijn maken om aan te geven dat dit de toekomst betreft. Dit moet dan 2018/2019 zijn. Setback II wordt dan 2018
DvdB: Done!
Duy kwam ook nog met een goede toevoeging. Wat cijfers bij de decisive moments. *% eerste twee jaar (as planned). Setback I (-1% - cost saving strategy and building up DWH). 2016-2017 – growth over 50% (restructuring investments) Early 2018 – Not really a setback, but more stagnation of growth. Not getting much more out of restructuring, new measures needed). 2018-2019 Data Science takes over
Misschien zelfs een extra slide wijden aan 2016-2017, om eerste stuk in Data Science stappen ook iets verder toe te lichten. 50% groei met alleen verbetering in structuur is op zich wel indrukwekkend
DvdB: Mannen, voel je vrij om deze slide nog aan te vullen met mooie cijfers
De groei mag iets prominenter zijn in de twee tussenliggende jaren (2016/2017). We groeiden met dik 50% ipv 16%. Daarnaast misschien laatste rode stuk een stippellijn maken om aan te geven dat dit de toekomst betreft. Dit moet dan 2018/2019 zijn. Setback II wordt dan 2018
DvdB: Done!
Duy kwam ook nog met een goede toevoeging. Wat cijfers bij de decisive moments. *% eerste twee jaar (as planned). Setback I (-1% - cost saving strategy and building up DWH). 2016-2017 – growth over 50% (restructuring investments) Early 2018 – Not really a setback, but more stagnation of growth. Not getting much more out of restructuring, new measures needed). 2018-2019 Data Science takes over
Misschien zelfs een extra slide wijden aan 2016-2017, om eerste stuk in Data Science stappen ook iets verder toe te lichten. 50% groei met alleen verbetering in structuur is op zich wel indrukwekkend
DvdB: Mannen, voel je vrij om deze slide nog aan te vullen met mooie cijfers
De groei mag iets prominenter zijn in de twee tussenliggende jaren (2016/2017). We groeiden met dik 50% ipv 16%. Daarnaast misschien laatste rode stuk een stippellijn maken om aan te geven dat dit de toekomst betreft. Dit moet dan 2018/2019 zijn. Setback II wordt dan 2018
DvdB: Done!
Duy kwam ook nog met een goede toevoeging. Wat cijfers bij de decisive moments. *% eerste twee jaar (as planned). Setback I (-1% - cost saving strategy and building up DWH). 2016-2017 – growth over 50% (restructuring investments) Early 2018 – Not really a setback, but more stagnation of growth. Not getting much more out of restructuring, new measures needed). 2018-2019 Data Science takes over
Misschien zelfs een extra slide wijden aan 2016-2017, om eerste stuk in Data Science stappen ook iets verder toe te lichten. 50% groei met alleen verbetering in structuur is op zich wel indrukwekkend
DvdB: Mannen, voel je vrij om deze slide nog aan te vullen met mooie cijfers
Moet hier bij het punt Business Intelligence nog tussen haakjes (DWH – Data Warehouse)? Om aan te geven dat we hier de datastructuur en tabellen hebben aangelegd?
DvdB: Done!
Verander het BuildingBlocks logo in het Spark logo (dit zijn allemaal tools, buildingblocks een bedrijf. Dit moeten we later zelf benoemen in de presentatie)
DvdB: Done!
DvdB: Kun je hier [NUMBER] aangeven hoeveel verschillende producten jullie hebben? Daarom heeft de klant goed begeleiding nodig
DvdB
DvdB
Bovenstaande fout qua pricing hebben we afgelopen week nog meegemaakt met het eerste project, dynamic pricing. Vriezers voor 10 euro te koop, wasmachines voor 20 euro…oeps
DvdB: Kan mooi zijn om dit te vertellen, maakt het dichter bij jezelf. Natuurlijk wel melden dat dit niet aan ons (lees: OTTO + BB) DS team ligt ;)
Wellicht leuk bij het rechterplaatje om hier 2 sheets van te maken. Eerste slide dan een vraagteken neerzetten? Dan aan zaal vragen, what could happen here? Dan wat interactie en laten we zien dat er zelfs erotiek kan komen te staan (omdat dit ook in ons assortiment zit en meermaals geklikt kan worden, dus geshowd kan worden).
DvdB: Done!
Welke modellen hebben jullie gebruikt bij Modelling stage? Is dat alleen matrix factorization (in het breedste zin van het woord)? Of nog meer tastbare voorbeelden voor de zaal?
DvdB gaat aan Coenraad vragen
DvdB: Ik ga aan Coenraad vragen of ie met Duy contact kan opnemen om dit samen te bespreken. Hij kan dat veel beter tot in detail vertellen
Deze slide is denk ik om te laten zien dat we (wanneer het live staat) nog steeds door blijven evalueren en dus ook verbeteren?)
DvdB: Eens! Dus voordat je live gaat met recommender, eerst goed testen in veilige omgeving (vorig slide). Maar ook daarna moet je blijven door evalueren en nog slimmer aan de knoppen draaien