Nouvellement installé en France, Netflix met en avant sa capacité à proposer du contenu personnalisé aux goûts de chacun via un service de suggestion poussé et exclusif. Mais comment fait Netflix pour élaborer une liste de programmes propres à nos goûts ? Comment utilisent-ils les données qu'ils récupèrent via les actions de l'utilisateur pour alimenter son algorithme de suggestion ? Les utilisateurs se méfient-ils de ces services qui utilisent leurs données ?
Algorithme de suggestion: Vos données au service de Netflix
1. Algorithme de suggestion
Vos données au service de Netflix
Emmanuel Nunes de Pontes et Cedric Jollec
L3 Industries Culturelles, Arts et Société
Université Lille 3 Charles-De-Gaulle
2. En quelques mots...
- Netflix est un service de vidéo à la demande par abonnement. Ils proposent de
visionner en streaming et en illimité un catalogue composé de films et de séries.
- L'entreprise a été fondée en 1997 à Los Gatos aux Etats-Unis par Reed Hastings.
- Netflix compte aujourd'hui plus de 50 millions d'abonnés dans 15 pays, dont la France,
où le service est disponible depuis le 18 septembre 2014.
- L'abonnement coûte environ entre 8 et 13€. Le forfait dépend du nombre d'écrans
profitant du service en simultané et de la qualité de l'image (standard, HD, ou ultra-HD).
Le service est financé dans sa quasi-totalité par ses abonnés et non par la publicité, ce
sont donc 50 millions de personnes qui échappent ainsi aux annonceurs.
- Le flux continu de diffusion web de Netflix est responsable du tiers de la
consommation de la bande passante mondiale.
3. Qu'est-ce qu'un algorithme ?
Un algorithme est une suite définie d'opérations ou de règles à
appliquer dans un ordre determiné, à un nombre défini de
données, pour arriver à un resultat en un nombre fini d'étapes.
Par exemple : Faire une recherche dans un dictionnaire est une
forme d'algorithme : On cherche d'abord notre mot grâce à la
première lettre, puis en cherchant par rapport à la seconde lettre
du mot etc …
Appliqué à l'informatique, il s'agit d'un système qui va
automatiquement suivre une suite d'opérations coposée
d'actions élémentaires appelées instructions.
4. « L'Algorithme de Suggestion »
- Particularité propre à Netflix et qui le démarque de ses concurrents : Son système de suggestion poussé.
Il s'agit d'un système breveté et exclusif à Netflix. Ils n'ont jamais voulu céder les droits à d'autres services
de SVOD ou à d'autres sites, marchands par exemple.
- Il s'agit d'un algorithme complexe permettant, via plusieurs moyens de récupération de données, de
proposer un programme bien définit à un utilisateur précis. En évaluant ses goûts, cet algorithme permet
au service de mettre en avant du contenu qui est susceptible de plaire à l'utilisateur.
- Cet algorithme est en amélioration constante. De 2006 à 2009, Netflix offrait le Prix Netflix et 1M de
dollars à quiconque pourrait améliorer l’algorithme Aujourd'hui, ces améliorations se basent sur des tests
effectués sur des échantillons d'utilisateurs, souvent à leur insu.
- C'est Neil Hunt est à la tête d'une équipe de 800
personne chargées du développement de l’algorithme au
sein de l'entreprise et de son amélioration. Cette section
représente à elle seule 8% des investissements de Netflix.
75 % des programmes consommés le sont grâce à son système de
recommandations et non pas par le biais du moteur de recherche.
5. Le système de suggestion en action
Pour mettre en image le système de suggestion et montrer sa pertinence, nous avons crée deux
comptes factices, basés sur des stéréotypes. Nous avons basé ce test sur le premier moyen qu'a
l'algorithme pour évaluer les goûts de l'utilisateur : Le service vous demande, à la création du
compte, de choisir trois films ou séries dans une liste pour créer une base sur laquelle
fonder ses propositions.
Pour le compte de « Michel », nous avons choisi des films d'action, et pour le compte
« Marie », plutôt des films romantiques.
6. Nous avons donc choisi trois films d'action
pour ce compte. Après un temps de
recherche, l'algorithme trouve dans le
catalogue ce qui peut correspondre aux
goûts de « Michel ».
Pour établir cette première liste, l'algorithme
se base sur les choix à l'inscription, mais
aussi sur d'autres moyens pour hiérarchiser
les contenus selon leur intérêt via des
processus que nous évoquerons ensuite.
7. Même chose pour le compte Marie
pour lequel nous avons choisi trois
films comédies romantiques. Le
résultat est différent et probant.
8. Ce qu'en pensent les utilisateurs
43%
57%
Toujours
Jamais
La plupart du
temps
« Je me laisse souvent guider par ce que me
propose Netflix, car même si ça manque
encore un peu de contenu, ça nous permet
de découvrir de nouvelles séries et d'étoffer
nos connaissances. »
(Nathan L., 24 ans, en concubinage, Expert
réseau et téléphonie, La Madeleine)
En général, trouvez-vous que le service de
suggestion marche bien, que les films et
séries proposés correspondent à vos
goûts ?
« A mon inscription, j'ai moi-même cherché
les programmes que je voulais regarder.
Maintenant, je fais rarement de recherches,
je regarde ce que Netflix propose jusqu'à
trouver quelque chose qui m'intéresse. »
(Celia A., 22 ans, célibataire, étudiante, Lille)
« Je cherche moi même les programmes
mais cela peut s'avérer intéressant quand il
me suggère des films qui collent aux
différents genres que j'ai l'habitude de
regarder et que je n'ai pas vu » (Frédéric P., 36
ans, marié, agent essai SNCF, Tours)
9. Comment ça marche ?
« Dis-moi ce que tu regardes je te dirai qui tu es »
- Dès l'inscription, choisir dans une liste trois programmes pour évaluer les goûts.
- Les films sont alors hiérarchisés mais avant tout, les genres sont hiérarchisés eux aussi par intérêt
dans la page (exemple : Le genre « film d'action » arrivera en premier sur la page de « Michel » alors que
la catégorie « Comédie Romantique » arrivera en premier sur la page de « Marie »)
- Une fois que vous avez commencé à utiliser le service, l'algorithme va analyser ce que vous regardez et
vous proposera d'autres programmes liés à celui que vous venez de voir.
- Le principal point de repère pour l'algorithme, ce sont les autres utilisateurs. Ainsi, les propositions qui
sont faites après le visionnage sont basées sur ce qu'ont regardé d'autres utilisateurs qui ont visionné le
même film. Et si vous ne suivez pas cette liste de proposition et que vous en choisissez autre chose,
l'algorithme entrera ce nouveau film dans ses calculs pour le prochain utilisateur qui regardera ce film. Et
ainsi de suite.
Propositions aprés avoir regardé Star
Trek
10. - L'algorithme prend aussi en compte si un usager regarde un programme dans son
entièreté. Ainsi, il prendra en compte ou non dans ses calculs le programme qu'il vient de
visionner, selon si le visionnage est abandonné au bout de deux minutes ou si l'usager a
visionner toutes les saisons d'un coup.
Episode regardé dans sa totalité
Regardé partiellement
- Pour améliorer ses suggestions, Netflix demande dès
l'inscription de participer à des « évaluations ». Ils
demandent ainsi de noter des films avec un système d'étoiles.
En comparant les évaluations d'un usagers avec ce qu'il
regarde, l'algorithme pourra affiner le profil de l'utilisateur et
ainsi s'en servir comme point de repère pour d'autres qui ont
regardé les mêmes contenus.
- A la base, l'algorithme de suggestion se basait
uniquement sur ces évaluations et ce système d'étoiles.
Mais Netflix remarqua que les résultats n'étaient pas assez
précis et ils choisirent de compléter ce système par d'autres
plus efficaces.
11. « Quand un utilisateur s’assoit pour choisir quelque chose à regarder, nous
n'avons que quelques minutes et au mieux 50 propositions possibles pour capter
son attention. Donc si nous pouvons utiliser le système de recommandation pour
être plus pertinents dans ces 50 premières propositions nous augmentons les
chances de le satisfaire »
- Neil Hunt, responsable du développement de l'algorithme de suggestion
Ces 50 propositions possibles correspondent à la pages d’accueil de Netflix. C'est pour cela qu'une
hiérarchisation des genre et des films en fonction des goûts de l'utilisateur est si important : Pour
avoir immédiatement ce qu'il attend et ce qu'il est censé aimé devant les yeux.
12. - L'algorithme prend aussi en compte la plate-forme utilisée et propose des programmes en fonction. (Un
programme humoristique court sera plus propice à un visionnage sur téléphone mobile alors qu'un film
sera plutôt proposé sur des plate-formes reliées à la télé.)
- Pour une recommandation encore plus précise, Netflix voudrait intégrer dans son algorithme de
suggestion une nouvelle option : Celle des recommandations en fonction de l'heure de la
journée. Par exemple, plus de dessins-animés après 16h quand les enfants rentrent de l’école.
- Pour constamment améliorer son algorithme, Netflix procède aussi à des tests sur des
groupes d'utilisateurs à leur insu. Ainsi, ils peuvent être scrutés en particulier et en détail, ou
encore être l'objet de test sur l’ergonomie de la page. Ils observent ainsi les réactions sans que la
personne ne le sache.
Note : On peut tout de même refuser d'être un cobaye en fouillant dans les options.
13. - Pour augmenter encore la précision et aller
au-delà d'une catégorisation basique de ses
films par genre, l'algorithme se base sur des
sous-catégories ultra-précises, ajoutée « à la
main » par les ingénieurs avec des tags
allant à l'extrême dans le détail. (exemple :
« films traitant du voyage dans le temps et
réalisés dans les années 80” »).
Récemment, un journaliste de The Atlantic a
référencé tout ces tags : Il y en a 76 897
(pour le moment). Ces sous-références
permettent de donner des tags ultra-précis et
d'évaluer un contenu selon des micro-critères
qui colleront au profil d'un utilisateur
pour lui être proposé.
14. Récupération de données d'utilisation :
Quels avantages pour Netflix ?
- L'utilité de ces analyses de données ne se limite pas au système de suggestion mais va
beaucoup plus loin. Elle ne sert pas qu'à améliorer l’expérience de l'utilisateur mais aussi
à aider Netflix dans son développement en tant que service et en tant que
société créatrice de contenus.
- Pour ce qui est de l'utilisation du service, un exemple très simple et évoqué par Neil
Hunt : Les images utilisées pour illustrer les programmes. En analysant le comportement
de 500 000 usagers à leur insu à travers 300 tests, ils ont pu s'apercevoir que le simple
fait de changer une image d'illustration pour modifier le nombre de visionnage
d'une série ou d'un film :
« En choisissant une image plutôt qu’une autre pour proposer «Breaking Bad», le
nombre de visionnages n’était pas le même. »
- Neil Hunt
15. Dans le même ordre d'idée, la différence entre l’ergonomie des pages de présentation de
programmes produits par Netflix et ceux qui ne le sont pas : Alors que les productions Netflix
héritent d'une ergonomie faite pour plaire à l'utilisateur selon les données étudiée, les
programmes qui ne sont pas produits par Netflix possèdent une présentation plus « austère ».
Page de présentation d'un programme
produit par Netflix
Page de présentation d'un contenu qui
n'est pas produit par Netflix
16. - Non seulement Netflix met en avant ses programmes en utilisant une ergonomie plus attrayante
pour ces derniers, basée sur les préférences de ses usagers, mais surtout, ils utilisent ces
données en tant que société créatrice de contenus.
- La série « House Of Cards », produite par Netflix, a été crée en suivant les données
amenées par le système de suggestion :
« Pour House of Cards, nous savions grâce à nos données, que nous avions un public
prêt pour un drame politique qui se passerait à Washington avec une storyline dramatique.
Et nous étions capables d’identifier dans notre base, les personnes spécifiquement
concernées. »
- Neil Hunt
17. Utilisation de données liées à l'utilisation : Des utilisateurs
heureux ou inquiets ?
- Netflix avoue de manière assumée comment leur système d'observation des données
d'utilisation marche.
- Comme tout système d'observation, il est légitime de se poser des questions sur sa légitimité et
surtout si cela dérange ou non le public du service.
« Je ne vois pas ça comme une intrusion ou
de l'espionnage. Je sais quand j'utilise des
services comme Netflix que mon activité est
analysée. J'utilise énormément Spotify aussi
et au final ça ne me dérange pas; au
contraire, ça me permet de découvrir des
séries/films que je ne connaissais pas » -
(Celia A., 22 ans, célibataire, étudiante, Lille)
« Ça ne m'inquiète absolument pas. Le
système marche dans les deux sens et il est
positif pour mon expérience… Tant qu'ils ne
s’immiscent pas plus loin dans la vie privée …
Et qu'ils n'utilisent pas mes données pour
créer des publicités ciblées.» (Nathan L., 24
ans, en concubinage, Expert réseau et téléphonie,
La Madeleine)
« Pour moi, c'est est une intrusion voire
même de l'espionnage. » - (Frédéric P., marié,
agent d'essai férroviaire, Joué-lès-Tours (37))
18. Selon cette étude du Boston Consulting Group « Le Big Data face au défi de la
confiance », 78 % des personnes en moyenne pensent qu'il est nécessaire d'être
prudent lorsqu'il s'agit de partager ses données, mais concernant l'usage des
médias et les préférences, 50 % des gens pensent que ça ne fait pas partie de la
sphère privée.
19. Alors pourquoi tant de gens font confiance à Netflix alors que ces derniers scrutent des
données que 50 % des sondées jugent tout de même comme étant privées ?
- En fait, il est surtout question de confiance entre collecteur et collecté. Il existe une forme d'acceptation de
l'utilisateur quand il s'agit de l'utilisation de ses données si celles-ci sont utilisées raisonnablement et à leur
profit. C'est une sorte contrat symbolique que l'étude du Boston Consulting Group décrit :
« La confiance est l’élément clé qui lie l’entreprise à ses clients. Elle est longue à s’établir mais peut être
ruinée très rapidement. Les études du BCG ont démontré que, dans un domaine aussi sensible que le Big
Data, la confiance sera l’élément déterminant pour permettre à l’entreprise d’avoir le plus large accès
possible aux données de ses clients, à condition qu’ils soient convaincus que ces données seront utilisées
de façon loyale et contrôlée.
[…] Le Big Data est au point de rencontre de trois volontés contradictoires :
- Celles des entreprises d’avoir accès au maximum de données personnelles de leurs clients afin
d’améliorer leurs offres de produits et services et leurs résultats économiques ;
- Celle de certains États et des instances de régulation qui entendent encadrer le plus étroitement possible
l’accès à ces données et leur utilisation ;
- Celle des consommateurs qui souhaitent bénéficier d’un service individualisé et pertinent, tout en gardant
le contrôle sur l’utilisation de leurs données.
Seules les entreprises qui sauront établir un lien de confiance avec leurs clients et le régulateur, par une
utilisation raisonnée des données personnelles, seront en mesure de réconcilier ces trois volontés
contradictoires. »
20. Finalement, on pourrait en conclure que Netflix réussit plutôt bien sa part du
contrat et que, l'utilisateur y trouvant son compte, est satisfait en général du
service, comme le montre ce sondage que nous avons initié :
4%
96%
Satisfait du
service
Pas satisfait
21. Pour résumer :
- Netflix propose un algorithme de suggestion de plus en plus poussé pour coller au maximum aux goûts
de ses utilisateurs et lui proposer ce qu'il veut voir.
- Il se sert aussi des données recueillies par l'algorithme pour élaborer et produire ses propres
programmes en les fondant sur ce que les utilisateurs veulent voir.
- Tout cela se fait en analysant et en récoltant un maximum d'informations sur les habitudes de visionnages
des utilisateurs, via différentes méthodes, et parfois à leur insu.
- Pourtant, les avis des utilisateurs sur cette pratique diverge. Si certains acceptent, comme s'il s'agissait
d'un accord qui va dans leur sens, qui leur offre en contre-partie d'avantages dans l'utilisation du service et
de son contenu, d'autres se montrent plus réticent à cette pratique.
- Mais comme l'a montré l'étude du BCG, il existe un contrat implicite entre l'utilisateur et le service :
L'utilisateur est plus enclin à partager ses données si ces dernières sont utilisées à son profit, à bon
escient, et avec transparence. En contre-partie, si ce contrat est respecté, le service a la confiance de ses
usagers en ce qui concerne ses données, l'entreprise peut perdurer. L’effondrement de la confiance
signifierai aussi la fin de l'entreprise.
- Netflix, qui continue de perdurer et de se développer, prouve qu'il a la confiance de ses utilisateurs et que
ce contrat est respecté.
22. WEBOGRAPHIE
- Anaëlle Grondin. Netflix mise beaucoup sur son système de recommandation personnalisé [en ligne]. 20 Minutes, 15
septembre 2014, mise à jour le 16 septembre 2014 [consulté le 7 novembre 2014]. Disponible sur:
http://www.20minutes.fr/medias/1443351-20140915-video-netflix-mise-beaucoup-systeme-recommandation-personnalisee
- Amélie Charnay. Interview : comment Netflix scrute l'activité de visionnage de ses abonnés [en ligne]. 01.net, 6
octobre 2014 [consulté le 7 novembre 2014]. Disponible sur:
http://www.01net.com/editorial/627544/interview-comment-netflix-scrute-lactivite-de-visionnage-de-ses-abonnes/
- Emmanuelle Delsol. L'homme qui se cache derrière les algorithmes de Netflix explique le succès du service de SVOD
[en ligne]. L'Usine Digitale, 18 septembre 2014 [consulté le 8 novembre 2014]. Disponible sur:
http://www.usine-digitale.fr/article/l-homme-qui-se-cache-derriere-les-algorithmes-de-netflix-explique-le-succes-du-service-- Fabien Major. 8 faits étonnants sur Netflix [en ligne]. Canoe.ca, le 15 septembre 2014 [consulté 9 novembre 2014].
Disponible sur: http://fr.canoe.ca/argent/chroniques/fabienmajor/archives/2014/09/20140915-094720.html
- Thomas Destouches. Netflix : le directeur technique nous explique comment ça marche ! [en ligne]. Allociné [consulté
le 8 novembre 2014]. Disponible sur : http://www.allocine.fr/article/fichearticle_gen_carticle=18636717.html
- ACM Recsys. RecSys 2014 Keynote by Neil Hunt: Quantifying the Value of Better Recommendations. Youtube.com. À
partir de 56:00.
http://www.youtube.com/watch?v=lYcDR8z-rRY (consultée le 10 novembre 2014)
23. - Vincent Coquaz, Comment Netflix cerne vos désirs (même inexprimés) [en ligne], arrêt sur image, 7 juillet 2014
[consulté le 7 novembre 2014]. Disponible sur :
http://www.arretsurimages.net/breves/2014-07-07/Comment-Netflix-cerne-vos-desirs-meme-inexprimes-id17672
- Alexis C. Madrigal, How Netflix Reverse Engineered Hollywood [en ligne], The Atlantic, 2 janvier 2014 [consulté le 7
novembre 2014]. Disponible sur :
http://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/?fb_action_ids==[]
- Sébastian Seibt, Netflix et le culte du big data : la traque des habitudes du télespectateur, France 24 [consulté le 7
novembre 2014]. Disponible sur :
http://www.france24.com/fr/20140521-netflix-france-big-data-house-cards-television-algorithme-recommandation-internet-- Phillipe Flajolet, Etienne Parisot: Qu’est-ce qu’un algorithme ? , Interstices [consulté le 27/11/2014]. Disponible sur:
https://interstices.info/jcms/c_5776/quest-ce-quun-algorithme
Article de recherche
- Umhoefer, C ; Rofé, J ; Lemarchand, S ; Baltassis, E ; Stragier, F ; Telle, N « Le Big Data au défi de la confiance »
(juin 2014), The Boston Consulting Group et DLA Piper. Disponible sur : http://www.bcg.fr/documents/file172040.pdf