Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

Guillaume Morissette - Big Data PME

155 Aufrufe

Veröffentlicht am

Présenté au WAQ17

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

Guillaume Morissette - Big Data PME

  1. 1. Intelligence artificielle et Big Data pour PMEs Développez un avantage concurrentiel grâce à vos données
  2. 2. L’intelligence artificielle De hier à aujourd’hui
  3. 3. 1942 La 1re école cybernétique Attribuée à Norbert Wiener ● Science des systèmes ● Multidisciplinaire ○ Biologie ○ Sociologie ○ Mathématiques ○ Etc ● Établit et formalise le principe de rétroaction
  4. 4. Le principe de rétroaction Connaissances + Règles de transformation Exemples: ● Robinet et température de l’eau ● “Cruise control” sur une voiture ● Thermostat ● Etc
  5. 5. 1950 La 2e école cybernétique Attribuée à Marvin Minsky et Alan Turing ● Représenter la connaissance ○ Faits ● Modéliser la pensée ○ Règles ● Arrivée des ordinateurs ○ Test de Turing ● Optimisme démesuré
  6. 6. 1969 La grande désillusion Attribuée à Marvin Minsky ● Modéliser la pensée est très complexe. ○ Parfois irrationnelle ● La connaissance est difficile à formaliser ● Nécessite une capacité de calcul dépassant les moyens de l’époque
  7. 7. L’héritage de la 2e cybernétique ● Automatisation de la logique de premier ordre ○ Prolog (1972) ○ Systèmes experts ● Réseaux neuronaux ○ Perceptrons (1957)
  8. 8. Les systèmes experts Faits Règles Application des règles pour déduire de nouveaux faits Nouveaux faits Aucun nouveaux faits ou conclusion atteinte Conclusion(s) Exemples: ● Systèmes d’analyse chimique (Dendral,1965) ● Systèmes de diagnostics médicaux (VisualDx,2001) ● Systèmes de génération d’horaires (UdeM,?)
  9. 9. Les réseaux neuronaux ● Visent à imiter la nature ○ Neurones et dendrites ○ Apprentissage en renforçant progressivement les liens entre les neurones (poids) ● Entièrement numérique ● Plusieurs variétés ○ Perceptrons ○ Carte de Kohonen ○ Etc
  10. 10. 1990 Un nouvel espoir ● Apparition d’internet ● Théorie de Vapnik-Chervonenkis (VC) ○ L’apprentissage est un processus statistique ○ Nécessite des données ○ Établit les bases de l’apprentissage automatique ● Prix des ordinateurs personnels baisse
  11. 11. ~2000 La désillusion contre-attaque ● Le rendement des investissements logiciels s’essoufle ● Explosion de la Bulle des “dot com” ● Apparition des premières entreprises “orientées données” ○ Google (IPO 2004) ○ Facebook (2004)
  12. 12. ~2010 Le retour de l’intelligence artificielle ● L’infonuagique (“Cloud”) rend accessibles des capacités de stockage et de calcul autrefois impensables ● Les outils d’apprentissage automatique permettent une approche “boîte noire” relativement accessible ● Émergence de la “science des données”
  13. 13. Algorithmes pour PMEs Créez de la valeur ajoutée avec vos données
  14. 14. Un algorithme, c’est quoi ? Origine: Al Khwarizmi, scientifique arabe ● Séquence d’opérations ● Donnant un résultat ● Dans un nombre fini d’opérations ● Peut être programmé (ou non)
  15. 15. Exemples ● Trier des valeurs ● Rechercher une valeur ● Addition/soustraction ● Google répond à votre recherche ● Facebook vous suggère d’aimer quelque chose ● Publicité ciblée ● Etc
  16. 16. Quelques algorithmes utiles pour les PMEs ● Segmentation/Classification ● Prédiction ● Détection d’anomalies ● Règles d’association ● Méthodes d’ensemble
  17. 17. Segmentation / Classification Objectif Séparer des éléments en groupes d’éléments similaires. Applications typiques ● Profils de clients ● Profils de paniers d’achat Algorithmes populaires ● K-Means (S) ● X-Means (S) ● DBSCAN (S) ● BIRCH (S) ● Espérance-maximisation (C) ● K-NN (C) ● Réseaux bayesiens (C) ● SVM (C)
  18. 18. Prédiction Objectif Estimer la valeur ou la tendance d’une mesure donnée Applications typiques ● Chiffre d’affaires ● Seuil de réapprovisionnement ● Spéculation boursière Algorithmes populaires ● Moyenne (...) ● Régression linéaire ● Régression logistique ● Mélanges gaussiens ● SVM
  19. 19. Prédiction Application: Prix de l’essence Client Entreprise de stations-service 24h Problématique À 18h chaque jour une décision doit être prise à savoir si on doit commander une livraison d’essence pour la nuit ou attendre le nouveau prix le lendemain matin. Jeu de données Système de gestion de pompes ● Niveaux d’essence des réservoirs ● Date Système de point de vente (POS) ● Ventes d’essence ● Date (Jours de la semaine, semaine du mois, mois, etc)
  20. 20. Prédiction Application: Prix de l’essence Analyse classique ● Les ventes et niveaux d’essence sont très périodiques et réguliers. Ils sont aussi corrélés à certaines lois du marché (Ex: jours de paie). 18h
  21. 21. Prédiction Application: Prix de l’essence Analyse par machine learning ● On peut déduire le coût de l’essence à partir des ventes sur les POS ● On utilise une SVM avec un noyau RBF pour la prédiction ● Prédire une valeur précise du prix futur ne donne pas le résultat escompté ● Par contre, prédire la direction du prix s’avère beaucoup mieux (~83%) contrairement à la prédiction par un expert (~71%), un gain de 12%
  22. 22. Détection d’anomalies Objectif Trouver des éléments qui diffèrent significativement des autres Applications typiques ● Détection de la fraude ● Optimisation de processus (80/20) Algorithmes populaires ● Loi de Benford ● Algorithmes de classification (2 classes)
  23. 23. Détection d’anomalies Application: Problèmes de transport Client Entreprise effectuant des visites aléatoires aux domiciles de détenus purgeant leur peine à domicile. Problématique Les profits ont chuté de plus de 20% dans la dernière année. Jeu de données Base de données du CRM ● Point de départ (Long./Lat.) ● Point d’arrivée (Long./Lat.) ● Distance à l’odomètre ● ID employé ● ID client ● Durée (Date de fin - Date de début) ● Vitesse moyenne (Distance/Durée) ● Saison
  24. 24. Détection d’anomalies Application: Problèmes de transport Analyse classique ● La distance totale parcourue est restée sensiblement la même ● Le nombre de visites est resté sensiblement le même ● La durée moyenne a diminué (ce qui devrait diminuer les coûts) ● Certains employés sont beaucoup plus efficaces que d’autres Analyse par machine learning ● Segmenter les visites avec K-Means donne 2 clusters très distincts ● L’un deux est constitué de visites par des employés “très efficaces” ● Le client décide de surveiller les employés “inefficaces”, sans succès.
  25. 25. Détection d’anomalies Problèmes de transport - Solution Solution La surveillance des employés “très efficaces” fournit la réponse ● Certains employés ne font pas leurs visites, passent tout droit en avant de la résidence (pour mêler la surveillance par GPS qui fournit la route suivie), et falsifient ainsi leurs feuilles de temps. ● Un simple changement au processus résout le problème: les employés doivent maintenant prendre une photo du détenu. PS: Ce problème est commun dans les environnements où la performance est mesurée par une durée moyenne, comme les centres d’appel
  26. 26. Règles d’association Objectif Trouver des relations entre des occurrences d’ événements/éléments Applications typiques ● Achats connexes ● Découvrir des patterns de comportement Algorithmes populaires ● Apriori ● ECLAT ● FP-Growth ● GSP ● SPADE ● FreeSpan
  27. 27. Règles d’association Application: Analyse du panier d’achats Client Entreprise possédant des stations-service avec des dépanneurs Problématique On cherche à maximiser les ventes en augmentant les ventes connexes (“Achats impulsifs”) Jeu de données Base de données des points de vente ● Factures ● Inventaire ○ Code de produit ○ Catégorie de produit
  28. 28. Règles d’association Application: Analyse du panier d’achats Analyse classique ● On peut compter les produits qui se vendent le mieux ● On peut dépendre de l’expertise d’un vendeur ● Il existe 2 types de vente: la vente directe où le client sait ce qu’il veut, et la vente connexe qui est décidée sur le champ. La stratégie classique est de mettre les produits à vente directe à l’arrière du magasin afin de faire déambuler le client parmi les possibilités d’achats impulsifs dans le magasin.
  29. 29. Règles d’association Application: Analyse du panier d’achats Analyse par machine learning ● Les règles d’association ont la forme “Si {A,B,C...} Alors {X,Y,Z...}” ● La plupart des outils fournissent aussi des métriques de support et confiance pour chaque règle ● On peut extraire plusieurs formes de régles ○ Produits connexes afin d’optimiser les promotions ■ Ex: Si un client achète un muffin, il achète aussi un petit café ○ Catégories connexes afin d’optimiser les présentoirs ■ Ex: Si un client achète de l’essence, il achète aussi de la nourriture ● Dans un contexte de vente en ligne, on peut se servir de ces données pour proposer des achats connexes au client
  30. 30. Quelques outils Pour des heures de plaisir...
  31. 31. Logiciels libres ● R ● Orange ● TensorFlow ● WEKA ● NLTK ● Etc
  32. 32. Logiciels commerciaux ● SAS ● SPSS ● MATLAB ● Statistica ● Etc
  33. 33. Big Data pour PMEs Où trouver des données
  34. 34. Sources de données des PMEs ● Comptabilité ● Boutique en ligne ● Réseaux sociaux ● CRM ● Instrumentation ● Bases de données ● Open data ● Web scraping ● Compétiteurs
  35. 35. Comptabilité Factures ● Tendances ● Combinaisons d’achats ● Séquences d’achats ● Prédictions ○ Ventes futures ○ Inventaire requis Comptes client ● Profils de clients ● Segmentation
  36. 36. Boutique en ligne Factures (suite) ● Paniers d’achats Comptes clients (suite) ● Traces numériques Catalogue de produits ● CTR ● Taux de conversion
  37. 37. Réseaux sociaux Applications Facebook (Clients) ● Profils détaillés ● Patterns d’intérêts ● Facteurs favorisant l’engagement
  38. 38. Système de gestion de la relation avec la clientèle (CRM) Ventes ● Tunnel d’achats ● Patterns de réussite Comptes clients (suite) ● Profils (segmentation) Support après vente ● Détection d’anomalies
  39. 39. Instrumentation Objets connectés ● Compteurs ● Caméras ● Horodateurs (“Punch”) ● Lecteurs de codes-barres ● Station météo
  40. 40. Merci!

×