1. Rappels et fin du cours passé : Power Bi
Éléments théoriques sur la perception visuelle
- Principe de distinction
- Principe de regroupement (Gestalt)
TP1 :
- Des questions ?
Quelques types de visualisations… importantes
- Sparklines… E. Tufte
- Small multiples (faceted)
- Bullet graphs S. Few
2. Mise en
contexte
Outils Power Bi
et Tableau
Principes des
base
Bonnes
pratiques
Approche
données
Conception des maquettes
pour les rapports
Indicateurs de gestion
pour le tableaux de
bords
Identifications des
besoins d’affaires
Choix de
solutions
techniques
Projet de science de
données
Extension Power Bi avec R ou
Python
Power Bi
M – Power
Query
Éléments
d’architecture
Mise en route
Approches
professionnelles
Exploration des
données
Aspects
techniques
Power Bi
DAX
3. Processus de création d’un tableau de bord Power BI
Capture de données
Profilage,
Nettoyage et
Transfo
Modélisation des
données
Visualisations
4. • Power BI est une maison avec un étage et un sous-
sol.
– Le sous-sol est l’endroit où on prépare les données
– L’étage est l’endroit où on visualise les données
– Apprentissage 1 : où se trouve l’ascenseur pour
monter/descendre ? Demandez à l’Accueil
Éditeur de requêtes
Modélisation, Visualisation, Publication
DAX
M, Power Query
5. Les données : capture, préparation puis visualisation
- Capture et Manipulations de données
- Modélisation de données
- Créer quelques visualisations de base
- Paramètres
- Langage DAX, une première mesure
- Mesure ou colonne calculée : le grand dilemme
- Filtres interactifs entre visualisations.
- Filtres page, Segments, multi-visuels…
- Ajouter des visualisations
- Tierces
- Pré-version
- Les 3 mousquetaires :
- Sparklines… E. Tufte – courbes de tendances
- Small multiples (faceted) - treillis
- Bullet graphs S. Few – graphs à puces
- Et…
- Formatage conditionnel
- Visualisation de type carte
- Creuser dans les données
- Visualisation de type Matrice
- Drill – Inter-rapport
- …
- Quelques généralités
- Panneaux de droite
- Visualisation : champ, format, analyse
- Formatage des nombres
- Agrégation par défaut
- Publier sur le Web et partager
6.
7. Paramètre pour le niveau au lieu d’un
niveau fixe
DAX : mesure pour aller
chercher la moyenne versus
valeur du paramètre
8. En analyse de données, on sépare les données en mesures et dimensions (attributs, champs).
Les dimensions catégorisent les données, les mesures évaluent des valeurs calculées.
En Power BI, on introduit la notion de mesure DAX (on oublie souvent le mot DAX) pour une
formule (formule mathématique comme la somme) qui est « portable » : une fois créée, elle ne
dépend pas d’une table ou d’une feuille spécifique, elle peut être utilisée dans plusieurs TCD
différents.
17. Astuce : Créer une table manuelle « dummy » afin d’y regrouper les mesures
Créer une mesure
Nombre total = CALCULATE(countx(ref_usagers,ref_usagers[Etudiant_ID]),all(ref_usagers))
Comparer la mesure à
- Nombre d’étudiants ID provenant de la table de référence
- Nombre d’étudiants ID provenant de la table de faits
- Et valider le comportement par rapport aux filtres…
- C’est simple, … mais ce n’est pas facile
23. L’attention : séparer
distinguer rapidement/facilement les éléments versus
l’environnement
comment notre vision perçoit, préfère, se laisse influencer et attirer
comment utiliser cette attention
Principes de Gestalt : regrouper
relier rapidement/facilement les éléments pour qu’ils fassent du
sens
comment notre vision regroupe-t-elle les informations,
comment influencer le regroupements souhaités
24. La vision
Selon Colin Ware, auteur du livre Information visualization
Nous absorbons plus d’information par la vision que par tous nos autres sens réunis
70% de nos récepteurs de sens sont sur la rétine de nos yeux.
Même que souvent, pour indiquer que nous avons compris, nous disons «Je vois! »
Stephen Few, dans son livre Show me the numbers dit aussi
Il y a un lien fort entre la vision, la pensée et la compréhension
Les « limites » de notre vision, les « pièges » efficaces à l’attraper doivent être connus
https://www.larousse.fr/encyclopedie/medical/vision/16963
30. Tache a Fermez l’oeil droit et fixez le + tout en rapprochant lentement
votre visage de l’écran. Que se passe-t-il
Tache aveugle ou tache de Mariotte
31. Les couleurs : le contraste, le contexte
Même si on peut bien vivre sans voir toutes les couleurs,
lorsqu’on parle de visualisation, ça devient très important
Contraste
32. La couleur : système HSL ou TSV : Hue, Saturation/Intensity, Lightness/Brightness
Teinte (longueur d’onde) – Saturation (pureté colorimétrique) – Luminosité (luminance)
Le « H » pour Hue (teinte) représente la couleur.
Le « S » pour saturation correspond à la pureté de la
couleur (l’absence de gris/blanc - vide en pourcentage).
Le « L » est la luminosité. Elle sert à quantifier la lumière
dans la teinte (l’intensité de blanc en pourcentage).
https://fr.wikipedia.org/wiki/Teinte_saturation_lumi%C3%A8re
https://www.24joursdeweb.fr/2018/hsl-le-systeme-de-couleur-parfait-pour-le-web-
design/#:~:text=Repr%C3%A9sentation%20visuelle%20de%20ce%20qu,si%20vous%20%C3%AAtes%20un%20hamster).
33. La couleur : système HSL ou TSV : Hue, Saturation, Lightness/Brightness
Teinte (longueur d’onde) – Saturation (pureté colorimétrique) – Luminosité (luminance)
La luminosité, ou “brillance”, spécifie la distance à
laquelle la couleur se trouve du blanc et du noir.
Un niveau de luminosité de 50% signifie que la
couleur est en équilibre parfait entre le clair et le
sombre, et demeure inchangée
le degré de saturation dépend de la distance à
laquelle on se trouve du gris.
https://la-cascade.io/utiliser-hsl-pour-vos-couleurs/
34. Les couleurs : daltonisme, …
http://www.declic.ph/depistage.asp?iddepistage=21
Test d’Ishihara
Environ 8% des hommes et 1% des femmes au Québec
Quel type de daltonien êtes vous
https://quebec.huffingtonpost.ca/2013/09/07/quel-type-de-daltonien-etes-vous-
faites-le-test_n_3887382.html
Simulateur : comment certains peuvent
percevoir les couleurs
https://www.color-blindness.com/coblis-color-blindness-simulator/
37. Le contexte est important, les illusions d’optique
sont nombreuses
Illusion de Müller-Lyer
https://sites.google.com/site/tpe44lesillusionsoptiques/home
38. Les longueurs et les surfaces, l’humain n’a pas la
même capacité à comparer des longueurs que
comparer des aires
Il n’est pas aussi facile de percevoir la distinction de valeur entre des surfaces qu’avec des
longueurs ou des positionnements
39. Couleurs
Rouge : Ça va mal
Jaune : Attention
Vert : Tout va bien
Le futur vers la droite
Carte géographique
L’eau est bleue
Le positionnement des continents et des océans
Les points cardinaux (Nord en haut, etc…)
Traitement précoce de l’information lié à
l’éducation (habitudes)
61. Small multiples (A trellis chart or grid of
small charts) : treillis ou petits multiples
- en R : ggplot2 – faceting
https://www.sharpsightlabs.com/blog/small-multiples-ggplot/
- En Power Bi, c’est disponible en préversion depuis
décembre 2020
- Fichiers – Options -
Fonctionnalités en préversion – Petits multiples
Maintenant c’est intégré !
64. EDA : Exploratory Data Analysis
Statistiques descriptives…
!pip install pandas==1.2.1
!pip install pandas-profiling==2.7.1
https://colab.research.google.com/
Besoin d’un compte gmail/google (gratuit)
Pas besoin d’installer python sur sa machine.
Restart Runtime après la première exécution (installations)
Puis mettre en commentaire les deux premières lignes (les install)
en les précédant d’un #
65. EDA : Exploratory Data Analysis
Statistiques descriptives…
import pandas as pd
import pandas_profiling as pp
data = pd.read_csv("/content/salaries.csv")
print(data)
eda = pp.ProfileReport(data)
eda.to_file(output_file="/content/final.html")
https://colab.research.google.com/
Besoin d’un compte gmail/google (gratuit)
Pas besoin d’installer python sur sa machine.