SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Mégadonnées :
Kit de survie
Guillaume Chicoisne, IVADO
TL;DR
• Vous avez besoin de professionnels pour traiter les données; les
professionnels ont besoin de vous pour les comprendre.
• Avec de grandes données viennent de grands pouvoirs, de grands
problèmes et de grandes responsabilités
• Le monde des données n’est pas le monde réel
Les projets avec
mégadonnées posent
les mêmes problèmes
que tout projet
impliquant des
données… mais
amplifiés, et d’autres
plus spécifiques.
Données?
Les données sont une façon de numériser le monde.
• Ce qui nous intéresse n’est pas forcément mesurable.
• Ce qui est facilement mesurable n’est pas forcément ce qui nous
intéresse.
• Les mesures indirectes doivent générer d’autant plus de méfiance.
Le monde des données n’est pas le monde réel.
Structure classique
Acquisition Traitement Interprétation
Monde des
données
Monde réel
Création
Annotation
Nettoyage
Collecte
Traduction
Validation
...
Analyse
Intégration
Fusion
Généralisation
Exploration
Modélisation
...
Décision
Exploration
Compréhension
Prédiction
Description
Mesure
Valorisation
Utilisation
...
Créer, acquérir, accéder
(le 80 % laborieux)
(un banquier et son client)
- C'est quoi l'problème ? Mes dollars m'appartiennent; j'suis supposé
pouvoir les retirer facilement ?!
- Non!
- Quoi ?
- Vos fémurs aussi vous appartiennent, pis vous ne pouvez pas les retirer
facilement!
(François Pérusse, philosophe québécois)
Traitement
• Grand choix de méthodes, depuis les modèles
statistiques simples, jusqu’à l’apprentissage profond.
• Toujours commencer par les méthodes les plus simples.
Interprétation
• Confronter les analyses au monde réel :
• Prendre ou appuyer une décision, mesurer une progression, explorer…
• Valider les résultats!
Visualisation
Big data — Une définition parmi d’autres
Approches basées sur les données
• Attention aux modèles récents (p. ex. : l’apprentissage profond)
• Nécessite des experts rares
• Complexité pour justifier les résultats
• Approche parfois disproportionnée pour le problème
• Sensibilité aux données non pertinentes
• Prolongation de l’historique, risque de limiter l’innovation
• Mais : exploration de solutions “non humaines”
Accès aux données : pas seulement des défis techniques
Aspects techniques : volume de données, réseau rapide, accès aux
sources, distribution des données et du calcul, etc.
Aspects non techniques : vie privée, droits d’utilisation, conformité,
confidentialité, sécurité… Responsabilité.
Trois notions parmi d’autres :
• Quasi-identificateurs
• Mi data es su data...
• Sécurité : attaques, défaillances, accidents, bévues…
TL;DR
• Vous avez besoin de professionnels pour traiter les données; les
professionnels ont besoin de vous pour les comprendre.
• Avec de grandes données viennent de grands pouvoirs, de grands
problèmes et de grandes responsabilités
• Le monde des données n’est pas le monde réel
Merci!
Besoin de détails ?
guillaume.chicoisne@ivado.ca
ivado.ca

Weitere ähnliche Inhalte

Ähnlich wie Mégadonnées : kit de survie

Infographie (Big?) Data - EnjoyDigitAll by BNP Paribas
Infographie (Big?) Data - EnjoyDigitAll by BNP ParibasInfographie (Big?) Data - EnjoyDigitAll by BNP Paribas
Infographie (Big?) Data - EnjoyDigitAll by BNP ParibasEnjoyDigitAll by BNP Paribas
 
Les nouveaux habits de la veille
Les nouveaux habits de la veilleLes nouveaux habits de la veille
Les nouveaux habits de la veilleBoostzone Institute
 
Les enjeux de la transformation numérique
Les enjeux de la transformation numériqueLes enjeux de la transformation numérique
Les enjeux de la transformation numériqueAntoine Vigneron
 
Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)
Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)
Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)Kezhan SHI
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Introspect event - 5 Juillet 2018 - Kyos threat challenges
Introspect event - 5 Juillet 2018 - Kyos threat challengesIntrospect event - 5 Juillet 2018 - Kyos threat challenges
Introspect event - 5 Juillet 2018 - Kyos threat challengesKyos
 
Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...
Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...
Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...Rennes Atalante
 
Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Micropole Group
 
« Vos logins s’il vous plaît » Les rapports ambigus des internautes aux servi...
« Vos logins s’il vous plaît »Les rapports ambigus des internautes aux servi...« Vos logins s’il vous plaît »Les rapports ambigus des internautes aux servi...
« Vos logins s’il vous plaît » Les rapports ambigus des internautes aux servi...Alexandre Coutant
 
Le metaverse, nouvel eldoradio des données personnelles
Le metaverse, nouvel eldoradio des données personnellesLe metaverse, nouvel eldoradio des données personnelles
Le metaverse, nouvel eldoradio des données personnellesPaperjam_redaction
 
Droit des marques & Big Data
Droit des marques & Big DataDroit des marques & Big Data
Droit des marques & Big DataCedric Manara
 
Six sigma & Big data
Six sigma & Big dataSix sigma & Big data
Six sigma & Big dataXL Groupe
 
Dataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalitésDataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalitésMicrosoft
 
Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...
Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...
Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...SOLLAN FRANCE
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdfOuailChoukhairi
 

Ähnlich wie Mégadonnées : kit de survie (20)

Sommaire datanomics
Sommaire datanomicsSommaire datanomics
Sommaire datanomics
 
Infographie (Big?) Data - EnjoyDigitAll by BNP Paribas
Infographie (Big?) Data - EnjoyDigitAll by BNP ParibasInfographie (Big?) Data - EnjoyDigitAll by BNP Paribas
Infographie (Big?) Data - EnjoyDigitAll by BNP Paribas
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
Les nouveaux habits de la veille
Les nouveaux habits de la veilleLes nouveaux habits de la veille
Les nouveaux habits de la veille
 
Les enjeux de la transformation numérique
Les enjeux de la transformation numériqueLes enjeux de la transformation numérique
Les enjeux de la transformation numérique
 
Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)
Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)
Ethique big data - Présentation Paul-Olivier Gibert (Digital & Ethics)
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Introspect event - 5 Juillet 2018 - Kyos threat challenges
Introspect event - 5 Juillet 2018 - Kyos threat challengesIntrospect event - 5 Juillet 2018 - Kyos threat challenges
Introspect event - 5 Juillet 2018 - Kyos threat challenges
 
Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...
Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...
Intelligence Artificielle et Data Science | Alexandre Termier de l'Inria-Iris...
 
Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017
 
siris1.pdf
siris1.pdfsiris1.pdf
siris1.pdf
 
« Vos logins s’il vous plaît » Les rapports ambigus des internautes aux servi...
« Vos logins s’il vous plaît »Les rapports ambigus des internautes aux servi...« Vos logins s’il vous plaît »Les rapports ambigus des internautes aux servi...
« Vos logins s’il vous plaît » Les rapports ambigus des internautes aux servi...
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Le metaverse, nouvel eldoradio des données personnelles
Le metaverse, nouvel eldoradio des données personnellesLe metaverse, nouvel eldoradio des données personnelles
Le metaverse, nouvel eldoradio des données personnelles
 
Droit des marques & Big Data
Droit des marques & Big DataDroit des marques & Big Data
Droit des marques & Big Data
 
Six sigma & Big data
Six sigma & Big dataSix sigma & Big data
Six sigma & Big data
 
Dataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalitésDataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalités
 
Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...
Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...
Déjeuner-débat EIM360 | Ressusciter vos données mortes à l’aide du Data Disco...
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 

Mehr von IRSST

Voir l’invisible : l’utilisation d’avatars
Voir l’invisible : l’utilisation d’avatarsVoir l’invisible : l’utilisation d’avatars
Voir l’invisible : l’utilisation d’avatarsIRSST
 
Les textiles intelligents au service des travailleurs - Des études de cas
Les textiles intelligents au service des travailleurs - Des études de casLes textiles intelligents au service des travailleurs - Des études de cas
Les textiles intelligents au service des travailleurs - Des études de casIRSST
 
Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...
Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...
Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...IRSST
 
Robots collaboratifs et SST : risques et opportunités
Robots collaboratifs et SST : risques et opportunitésRobots collaboratifs et SST : risques et opportunités
Robots collaboratifs et SST : risques et opportunitésIRSST
 
Données massives en hygiène du travail, exploitation des banques de mesures d...
Données massives en hygiène du travail, exploitation des banques de mesures d...Données massives en hygiène du travail, exploitation des banques de mesures d...
Données massives en hygiène du travail, exploitation des banques de mesures d...IRSST
 
Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...
Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...
Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...IRSST
 
Innovation technologique et changements organisationnels; quels enjeux pour l...
Innovation technologique et changements organisationnels; quels enjeux pour l...Innovation technologique et changements organisationnels; quels enjeux pour l...
Innovation technologique et changements organisationnels; quels enjeux pour l...IRSST
 
Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...
Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...
Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...IRSST
 
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?IRSST
 

Mehr von IRSST (9)

Voir l’invisible : l’utilisation d’avatars
Voir l’invisible : l’utilisation d’avatarsVoir l’invisible : l’utilisation d’avatars
Voir l’invisible : l’utilisation d’avatars
 
Les textiles intelligents au service des travailleurs - Des études de cas
Les textiles intelligents au service des travailleurs - Des études de casLes textiles intelligents au service des travailleurs - Des études de cas
Les textiles intelligents au service des travailleurs - Des études de cas
 
Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...
Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...
Savoir-faire, défis et opportunités : Axe ergonomie et sécurité du nouveau la...
 
Robots collaboratifs et SST : risques et opportunités
Robots collaboratifs et SST : risques et opportunitésRobots collaboratifs et SST : risques et opportunités
Robots collaboratifs et SST : risques et opportunités
 
Données massives en hygiène du travail, exploitation des banques de mesures d...
Données massives en hygiène du travail, exploitation des banques de mesures d...Données massives en hygiène du travail, exploitation des banques de mesures d...
Données massives en hygiène du travail, exploitation des banques de mesures d...
 
Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...
Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...
Immersion 360 : un environnement sonore virtuel pour l’évaluation et la réada...
 
Innovation technologique et changements organisationnels; quels enjeux pour l...
Innovation technologique et changements organisationnels; quels enjeux pour l...Innovation technologique et changements organisationnels; quels enjeux pour l...
Innovation technologique et changements organisationnels; quels enjeux pour l...
 
Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...
Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...
Le travail à l'ère digitale : les impacts des technologies perturbatrices sur...
 
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
Une révolution technologique à nos portes ; nos organisations sont-elles prêtes?
 

Mégadonnées : kit de survie

  • 1. Mégadonnées : Kit de survie Guillaume Chicoisne, IVADO
  • 2. TL;DR • Vous avez besoin de professionnels pour traiter les données; les professionnels ont besoin de vous pour les comprendre. • Avec de grandes données viennent de grands pouvoirs, de grands problèmes et de grandes responsabilités • Le monde des données n’est pas le monde réel
  • 3. Les projets avec mégadonnées posent les mêmes problèmes que tout projet impliquant des données… mais amplifiés, et d’autres plus spécifiques.
  • 4. Données? Les données sont une façon de numériser le monde. • Ce qui nous intéresse n’est pas forcément mesurable. • Ce qui est facilement mesurable n’est pas forcément ce qui nous intéresse. • Les mesures indirectes doivent générer d’autant plus de méfiance. Le monde des données n’est pas le monde réel.
  • 5. Structure classique Acquisition Traitement Interprétation Monde des données Monde réel Création Annotation Nettoyage Collecte Traduction Validation ... Analyse Intégration Fusion Généralisation Exploration Modélisation ... Décision Exploration Compréhension Prédiction Description Mesure Valorisation Utilisation ...
  • 6. Créer, acquérir, accéder (le 80 % laborieux) (un banquier et son client) - C'est quoi l'problème ? Mes dollars m'appartiennent; j'suis supposé pouvoir les retirer facilement ?! - Non! - Quoi ? - Vos fémurs aussi vous appartiennent, pis vous ne pouvez pas les retirer facilement! (François Pérusse, philosophe québécois)
  • 7. Traitement • Grand choix de méthodes, depuis les modèles statistiques simples, jusqu’à l’apprentissage profond. • Toujours commencer par les méthodes les plus simples.
  • 8. Interprétation • Confronter les analyses au monde réel : • Prendre ou appuyer une décision, mesurer une progression, explorer… • Valider les résultats!
  • 10. Big data — Une définition parmi d’autres
  • 11. Approches basées sur les données • Attention aux modèles récents (p. ex. : l’apprentissage profond) • Nécessite des experts rares • Complexité pour justifier les résultats • Approche parfois disproportionnée pour le problème • Sensibilité aux données non pertinentes • Prolongation de l’historique, risque de limiter l’innovation • Mais : exploration de solutions “non humaines”
  • 12. Accès aux données : pas seulement des défis techniques Aspects techniques : volume de données, réseau rapide, accès aux sources, distribution des données et du calcul, etc. Aspects non techniques : vie privée, droits d’utilisation, conformité, confidentialité, sécurité… Responsabilité. Trois notions parmi d’autres : • Quasi-identificateurs • Mi data es su data... • Sécurité : attaques, défaillances, accidents, bévues…
  • 13. TL;DR • Vous avez besoin de professionnels pour traiter les données; les professionnels ont besoin de vous pour les comprendre. • Avec de grandes données viennent de grands pouvoirs, de grands problèmes et de grandes responsabilités • Le monde des données n’est pas le monde réel
  • 14. Merci! Besoin de détails ? guillaume.chicoisne@ivado.ca ivado.ca