SlideShare ist ein Scribd-Unternehmen logo
1 von 184
Downloaden Sie, um offline zu lesen
GROUPE MIAGE Pr Hammoucha Yassine
- 1 -
GROUPE MIAGE Pr Hammoucha Yassine
- 1 -
GROUPE MIAGE Pr Hammoucha Yassine
Sommaire
Les statistiques descriptives……………………………………………………...……….…….…....4
I-Terminologie.……………………………………………………......………………….…...…….4
II- Types de critères, de caractères ou de variables……………………..………………….……….6
1.Caractères quantitatifs……………………………………………………….……...…………….6
2. Caractère qualitatif………………………………………..….………...…………...…………….9
En résumé…………………………………………………...…...…………………….………….12
III- Tableaux statistiques……...…...…………...…...………...…...……...…...……………………12
A- les tableaux à un seul caractère……...…...…………...…...………...…...……...….……………14
B- Les tableaux à deux caractères……...…...…………...…...………...…...………………………18
C- Les différentes distributions statistiques……...…...…………...…...………....…………………21
IV- Représentations graphiques……...…...…………...…...………...…...……...…………………25
1. Représentations des distributions à une dimension……...…...…………...…...…...……………25
2.Représentations des distributions à deux dimensions……...…...…………...…...………………34
3.Autres représentations graphiques……...…...…………...…...………...…...……………………37
V- Caractéristiques de tendance centrale et de position……...…...…………...…...………………38
A- Mode……...…...…………...…...………...…...……...…...…………………….………………39
B- Médiane……...…...…………...…...………...…...……...………………....……………………41
C- Moyenne arithmétique……...…...…………...…...………...…...…….........……………………44
D- Moyenne géométrique……...…...…………...…...………...…...……...…......…………………48
E- Moyenne harmonique……...…...…………...…...………...…...……...…...……...….…………49
F- Moyenne quadratique……...…...…………...…...………...…...……...…...……………………50
G- Quantiles……...…...…………...…...………...…...……...…...……………….……...…………51
H- Le choix d’une caractéristique de tendance centrale……...…...…………......…………………52
VI- Caractéristiques de dispersion……...…...…………...…...………...……..……………………53
Introduction……...…...…………...…...………...…...…….........................…...……………………53
Les écarts simples……...…...…………...…...…………...…...…...……...…...……………………53
A- l’étendue……...…...…………...…...………...……………….....……...…...……………………53
B- Intervalle inter-quartile……...…...…………...….....………...…...……...…...……………………54
C- L’écart absolu moyen……...…...…………...…...…………...…...……...…...……………………54
D - Variance et écart-type……...…...…………...…...………...…......……...…...……………………55
E- Coefficient de variation……...…...…………...…...………...….....……...…...……………………56
VII- La concentration……...…...…………...…...………...…...……...……....……………………56
A- Valeurs globales……...…...…………...…...………...…...……...…...………….………………56
B-Médiale……...…...…………...…...………...…...……...…...…………………………………...56
C- Courbe de concentration (ou de LORENZ) ……...…...…………...…...………...……………57
D- Indice de GINI……...…...………..………...…...………...…...……...…...……………………58
VIII- Les séries à double entrées : régression linéaire (corrélation) ……...…...…………...………59
1- notion de tableau de contingence……...…...…………...…...………...…...……………………59
A. une distribution statistique double……...…...…………...…...………...……..……………………59
B. distributions marginales……...…...…………...…...………...…...……...…...……………….……59
C. Les distributions conditionnelles……...…...…………..……...…...……...…...……………………60
2- généralisation du tableau de contingences……...…...…………...…...………...…...……....……60
3- La régression linéaire……...…...…………...…...………...…...……...…...………………..……61
A. Présentation du problème……...…...…………...…...………...…...……...…...………….………61
B. la méthode des moindres carrés……...…...…………...…...………...…...……...…...……….……62
- 2 -
GROUPE MIAGE Pr Hammoucha Yassine
C. Calcul des paramètres de la droite de régression……...…...…………...…...………....…………….63
4- la corrélation linéaire……...…...…………...…...………...…...…….....…...…………..……...…65
IX- Analyse Des Séries Chronologiques……...…...…………...…...………...……………………69
1 – Généralités……...…...…………...…...………...…...……...….....................……………………69
A. Définition……...…...…………...…...………...…...……...…...…………………………………69
B. les différentes composantes d’une série chronologique……...…...…………...…...………...………69
C. intérêt d’une analyse d’une série chronologique……...…...…………...…...………...…...…………70
2 – l’analyse de la tendance longue : « trend » ……...…...…………...…...………...…...…………70
A. la méthode des moyennes mobiles……...…...…………...…...………...…...…….......……………70
B. Opérations sur les matrices……...…...…………...…...………...…...……...…...…………………70
X- Les Probabilités et l’analyse combinatoire……...…...…………...…...…....……………………71
1- Le modèle probabiliste……...…...…………...…...………...…...……...…...………………...…71
A- Evènements……...…...…………...…...………...…...……...…...………………………….……71
B- Loi de probabilité, espace de probabilité……...…...…………...…...………...……………………72
C- Le cas où les évènements élémentaires sont équiprobables……...…...………...……………………74
D- Exercices……...…...…………...…...………...…...……...….........................……………………75
2- Probabilités conditionnelles……...…...…………...…...………...…...…….……………………76
A- Définition……...…...…………...…...………...…...……...…...…………………………………76
B- Deux résultats de décomposition……...…...…………...…...………...…...…….…………………76
C- Evènements indépendants……...…...…………...…...………...…...……...…....…………………78
D- Exercices……...…...…………...…...………...…...……...………………....……………………79
XI- Les variables aléatoires……...…...…………...…...………...…...……...…...….………………80
1- Généralités……...…...…………...…...………...…...……...…...……………..…………………80
A- Définitions……...…...…………...…...………...…...……...…...………………...………………80
B- Variables aléatoires discrètes, variables aléatoires à densité……...…...…………...…...……..………82
C- Couples de variables aléatoires……...…...…………...…...………...…...……...…...........…………83
D- Variables aléatoires indépendantes……...…...…………...…...………...…..........…………………84
E- Exercices……...…...…………...…...………...…...……...……………….....……………………85
2- Caractéristiques numériques des variables aléatoires….....…………………………...…………86
A- Espérance….....…………………………………………………………………………….……86
B- Variance, covariance……...…...……………....…...………...…...……...…...……………………87
C- Exercices……...…...…………...…...…………………..…...…...……...…...……………………90
3-Variables aléatoires usuelles……...…...…………...…...………...…...……...…...………………90
A- Loi de bernoulli……...…...…………...…...………...…...……...…...……………………...……90
B- Loi Binomiale……...…...…………...…...………...…...……...…...…………………………..…91
C- Loi uniforme……...…...…………...…...………...…...……...…...………………………………91
D- Loi exponentielle……...…...…………...…...………...…...……...…...………………….………91
E- Loi de Poisson……...…...…………...…...………...…...……...…...……………………..………92
F- Loi Normale……...…...…………...…...………...…...……...…...…………………….…………92
G-Exercices……...…...…………...…...………...…...……...…...…………………………..………93
4-Caractéristiques des lois usuelles……...…...…………...…...………...…...……...…....…………94
A-Variables aléatoires réelles discrètes……...…...…………...…...………...…...……..………………94
B-Variables aléatoires réelles continues……...…...…………...…...………...…...……………………94
Exercices corrigés……...…...…………...…...………...…...…………......…...……………………96
Exercices……...…...…………...…...………...…...……...…...………………...…………………141
Bibliographie……...…...…………...…...………...…...……...…...………………………………
- 3 -
GROUPE MIAGE Pr Hammoucha Yassine
Chapitre I- Les statistiques descriptives
I-Terminologie :
1. Statistique :
La statistique est une méthode scientifique dont l’objet est de recueillir, d’organiser,
de résumer et d’analyser les données d’une enquête, d’une étude o d’une expérience,
aussi bien que de tirer les conclusions logiques et de prendre les décisions qui
s’imposent à partir des analyses effectuées.
Les statistiques se sont des données chiffrées relatives à un phénomène étudié
collectés par la statistique.
Exemple : des statistiques du chômage.
Statistique descriptive: classification des données et leur traitement afin de les rendre
utilisables et permettre leur interprétation.
2. Population :
Ensemble d'individus définis par une propriété commune donnée.
Exemple : *si l’on veut étudier la durée de vie des ampoules électriques fabriquées par
une compagnie, la population considérée est l’ensemble de toutes les ampoules
fabriquées par cette compagnie.
*Age des étudiants de 1
ère
année : l’ensemble étudié c’est l’âge.
3. Echantillon :
Sous-ensemble de la population. Exemple : pour établir la durée de vie des ampoules
électriques produites par une machine, on peut prélever au hasard un certain nombre
d’ampoules - un échantillon- parmi toutes les celles produites par cette machine.
L’échantillonnage représente l’ensemble des opérations qui ont pour objet de
prélever un certain nombre d’individus dans une population donnée.
4. Individu ou unité statistique :
Chaque élément de la population ou de l’échantillon.
Exemple : dans l’exemple précédant, chaque ampoule constitue un individu ou une
unité statistique.
5. La taille :
Représente le nombre d’individus d’un échantillon ou d’une population. Elle est
symbolisée par « n » dans le cas d’un échantillon et par « N » dans le cas d’une
population.
6. Le caractère :
- 4 -
GROUPE MIAGE Pr Hammoucha Yassine
C’est l’aspect particulier que l’on désire étudier.
Exemple : concernant un groupe de personnes, on peut s’intéresser à leur âge, leur sexe
leur taille…
7. Les modalités :
Les différentes manières d’être que peut présenter un caractère.
Exemple 1 : le sexe est un caractère qui présente deux modalités : féminin ou masculin
Exemple 2 : quant au nombre d’enfants par famille, les modalités de ce caractère
peuvent être 0,1, 2,3…,20.
8. Caractère qualitatif :
Ses modalités ne s’expriment pas par un nombre
Exemple : la religion, le sexe, l’opinion…
9. Caractère quantitatif :
Ses modalités sont numériques.
Exemple : l’age, la taille, le poids…
10. Caractère quantitatif discret ou discontinu
L’ensemble des valeurs que peut prendre le caractère est fini ou dénombrable. Le plus
Souvent, ces valeurs sont entières.
Exemple :le nombre d’enfant dans une famille, le nombre de téléviseurs par foyer et la
pointure des souliers.
11. Caractère quantitatif continu :
Le caractère peut prendre théoriquement n’importe quelle valeur dans un intervalle
donné de nombres réels.
Exemple : la taille d’un individu, le poids…
12. Série statistique :
L’ensemble des différentes données associées à un certain nombre d’individus.
Exemple : la série suivante résulte d’une courte enquête auprès de quelques personnes
pour connaître leur âge :
18 21 19 19 17 22 27 18 18 17 20 20 23
13. Les recensemen s
t
- 5 -
GROUPE MIAGE Pr Hammoucha Yassine
Sont des opérations issues du dénombrement, qui consistent à étudier de façon
exhaustive et en fonction de plusieurs critères tous les éléments d’une population
Ne pas confondre «dénombrement» et «recensement»
*Le dénombrement: comptage des individus d’une population
*Le recensement: chiffrer les données selon plusieurs aspects (âge, sexe,
chiffred’affaires, etc.)
Exemple Explicatif Des Notions Importants
II- Types de critères, de caractères ou de variables
Population urbaine marocaine par groupe d’âge et sexe (en
millier)
Population: Population urbaine marocaine en 2005 et 2006
Individu: Population urbaine
Caractère: Groupe d’âge et sexe
1. Caractères quantitatifs
Variables numériques et mesurables exprimant une quantité
Exemple: Chiffre d’Affaires d’une entreprise; taux de chômage; taille; PIB, etc
Les variables quantitatives peuvent être classées en :
a. Variables quantitatives discrètes ou discontinues
b. Variables quantitatives continues
a. Variable quantitative discrète (discontinue)
Elle est représentée par un nombre fini de valeurs (Ex: nombre d’enfant par ménage;
nombre d’hospitalisation par patient, etc.)
Les modalités de la variable peuvent être traitées mathématiquement (par des
opérations mathématiques de base)
- 6 -
GROUPE MIAGE Pr Hammoucha Yassine
Exemple: enquête réalisée auprès de 20 femmes casablancaises nées en 1970 sur le
nombre d’enfants qu’elles ont eus
Nombre d’enfants/femmes
Nombre d’enfants Effectif de femmes
0 1
1 3
2 5
3 5
4 4
5 2
Total 20
b. Variable quantitative continue
Elle peut prendre un nombre infini de valeurs dans son intervalle de définition (Ex:
taille, revenus, CA, poids, etc.)
Il s’agit de grandeurs liées à l’espace(longueur, surface), au temps(âge, durée, vitesse), à
la masse(poids, teneur), à la monnaie(salaire, CA)
Les variables continues peuvent être regroupées en classe: un individu qui pèse 76,5
Kg sera repéré dans une classe de poids de [76-77]
Lorsque les données sont regroupées en classe, il faut définir les extrémités de classe
r la «borne inférieure» et la «borne supérieure» des classes
I t inclues ou non dans
les classes
Exemple 1:
Il faut précise
l faut préciser sans ambiguïté si les valeurs des extrémités son
nombre d’enfants par femme
[
ignifie que la valeur «2» est inclue dans la classe
ue la valeur «4» est exclue de la classe
To
et une
Classe [2 –4
«[2 –» s
« –4 [» signifie q
us les éléments de la population étudiée (femmes) doivent se retrouver dans une
seule classe
- 7 -
GROUPE MIAGE Pr Hammoucha Yassine
Exemple 2:
Pour des raisons pratiques, on retient généralement comme extrémités de classes des
valeurs «rondes» afin d’effectuer aisément des calculs sur les extrémités de classes
plitude des classes et du centre des classes.
comme pour le calcul de l’am
b.1- L’amplitude de classe
L’amplitude de classe=la différence entre la valeur de l’extrémité supérieure et la
L’amplitude a d’une classe i sera donnée par la formule suivante :
valeur de l’extrémité inférieure
Exemple 1:
xemple 2:
Salaires mensuels des employés d’une entreprise «X» en DH au 31/12/2006
classes de salaires :
-De 6000 à moins de 7000 DH: [6000 –7000[
Cette classe comprendra un employé dont le salaire = 6999 ta dis qu’un
salarié dont le revenu = 7000 s’en trouvera exclu
moins de 9000 DH: [7000 –9000[
DH: [9000
3
n
-De7000 à
-De9000 à moins de 12 000 –12 000[
L’amplitude ai de la classe [6000 –7000[
E
Nombre d’enfants par femme
- 8 -
GROUPE MIAGE Pr Hammoucha Yassine
Exemple 3:
b.2- Le centre de classe
classe=la moyenne des extrémités de classe
L
Le centre de
e centre c d’une classe i sera donnée par la formule suivante :
Exemple 1:
Exemple 2:
A Ne Pas Oublier
Salaires des employés de l’entreprise «X» en DH
L’amplitude de la deuxième classe est 2 fois plus grande que celle de la première
classe
L’amplitude de la troisième classe est 3 fois plus grande que celle de la première
classe
Cas où les amplitudes sont égales (Nombre d’enfants par femme)
Cas de classes d’amplitudes inégales (Salaires des employés de l’entreprise «X» en
DH)
- 9 -
GROUPE MIAGE Pr Hammoucha Yassine
2.Caractère qualitatif:
Ne peut faire l’objet d’une mesure car il ne se présente pas sous forme numérique.(Ex:
u; section du bac; catégorie socio-professionnelle; etc.)
• On ne peut pas effectuer d’opérations arithmétiques sur les caractères qualitatifs
Les caractères qualitatifs se déclinent en plusieurs Modalités:
Modalités:: les différentes valeurs prises par un caractère qualitatif
Exemple 1: la variable«sexe» à deux modalités «Masculin» «Feminin»
Exemple 2: la variable «couleurs des yeux» peut prendre comme modalités «Noir»
«Brun» «Bleu» «Vert» «Gris»
Exemple 3:
couleur de pea
(on ne peut additionner les couleurs de peau des êtres humains)
- 10 -
Si la population est décrite selon le caractère «CSP agrégées», les différentes
modalités seront
GROUPE MIAGE Pr Hammoucha Yassine
2.a- Les mod ent
alités d’un caractère qualitatif sont exhaustives et mutuellem
incompatibles
Exhaustives: à chaque individu doit correspondre une modalité du caractère
Exemple: enquête sur l’état matrimonial d’un groupe d’individu
modalités du caractère «Etat matrimonial» : Célibataire, Marié, Veuf,
Pour satisfaire la condition d’exhaustivité, on doit avoir quatre
Divorcé
: Un individu ne peut être à la fois «célibataire» et «marié»
voir être classé dans une et une seule
2.b- Les modalités d’un caractère qualitatif peuvent être ordinales ou
Incompatibles: Chaque individu doit pouvoir être classé dans une seule
modalité du caractère
Exemple
Chaque individu d’un caractère doit pou
modalité
nominales
Les modalités ordinales: peuvent être classées ou hiérarchisées
Exemple: Enquête réalisée en 2006 par l’association «Maroc Entrepreneur» sur
Pas
le degré de satisfaction des marocains ayant vécu à l’étranger et franchi le cap du
retour au Maroc
- Le Caractère: «Degré de satisfaction»
- Les :
modalités du Caractère «Satisfait», «Assez Satisfait», «Peu Satisfait», «
Satisfait»
L
Le classement effectué va de l’opinion «Satisfait» à l’opinion «
es modalités sont ordinales car on peut les classer :
Pas Satisfait»
d’une préférence positive à une préférence de plus en plus négative
Les modalités ordinales ne peuvent faire l’objet d’aucune opération
arithmétique
On passe
- 11 -
Les modalités nominales: ne peuvent pas être classées (hiérarchisées)
Exemple: Classement d’un groupe de 15 étudiants selon leur ville de naissance
GROUPE MIAGE Pr Hammoucha Yassine
Les 4 modalités du caractère «Ville de naissance» sont nominales donc elles ne
peuvent faire l’objet d’aucun classement hiérarchique
En résumé
leaux statistiques :
umer les données «brutes»
.
III- Tab
L’un des objectifs de la statistique descriptive est de rés
recueillies sur une population dans des tableaux statistiques
Avantage:
*Présentation des données de façon lisible
ne: informations relatives à chaque individu
E
*En lig
*En colonne: critères ou caractères étudiés
xemple 1:
Enquête d’opinion réalisée auprès de 9 étudiants de premières années TSGE
rchitecture
yenne"},{"
Rime",18,"ES","Bonne"},{"Semlali","Mohammed",19,"G","Médiocre"},{"
Salma",17,"S","Trèsbonne"},{"Yacoubi","Karim",18,"L","Trèsbonne"}}
umain
Données recueillies : nom, prénom, âge, série du bac, opinion sur l’a
de l’institut
Matrice des données:{{"Alaoui","Fatima",18,"L","Trèsbonne"},{"
Samira",17,"S","Bonne"},{"Omrani","Fouad",19,"S","Trèsbonne"},{"
Amine",20,"S","Trèsbonne"},{"Rafik","Basma",19,"L","Mo
La matrice de données n’est pas lisible pour l’esprit h
- 12 -
GROUPE MIAGE Pr Hammoucha Yassine
n des données dans un tableau
Présentatio
Tab 1: Résultat de l’enquête effectuée auprès des étudiants de l’institut
Exemple 2:
Nombre d’enfants par famille observé dans un échantillon de 56 familles
enquête auprès d’un échantillon de 56 familles marocaines sur le nombre d’enfant
par ménage
Données brutes: 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4
4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 8 9
Les données brutes ne sont pas lisibles
Regroupement des données dans un tableau pour faciliter le
traitement et les interprétations
- 13 -
GROUPE MIAGE Pr Hammoucha Yassine
La première colonne du tableau reprend les différentes modalités (xi) prises par la
variable ou le caractère nombre d’enfants/ménage
La deuxième colonne présente les effectifs (ni) (fréquences absolues): le nombre
d’individus correspondant à chaque modalité du caractère
haque cas du tableau dénombre les individus considérés comme équivalents face au
ion
C
phénomène étudié
L’ensemble des modalités et des effectifs d’un caractère forment une distribut
statistique ou une série statistique
e doit respecter des principes généraux:
ter des intitulés de lignes et de colonnes clairement définis
Le tableau doit préciser les unit ndre le mètre avec le
mètre carré, le millier avec le million, le
Le tableau doit préciser la source nnées sont
empruntées à une publication ou à un o
Les tableaux statistiques peuvent être à ns
À «une dimension» si un seul carac ié (nombre d’enfants/ménage)
À «deux dimensions» si l’on retient deux caractères (nombre et sexe des
enfants/ménage)
La présentation d’un tableau statistiqu
Le tableau doit porter un titre précisant son contenu : le phénomène étudié , la
façon dont il est étudié ,le lieu, la date, etc.
Le tableau doit por
és utilisées : ne pas confo
DH avec l’Euro, etc.
des informations lorsque les do
rganisme
une ou à plusieurs dimensio
tère est étud
A- les tableaux à un seul caractère
onsidérons une population statistique de n individus décrite selon le caractère x dont
C
les k modalités sont x1, x2, ..., xi, ...., xk
représente le nombre
ou «fréquence absolue», présentant
La somme des «effectifs partiels»
ni est «l’effectif total» n de la
ni
d’individus, appelé «effectif partiel»
la modalité xi
population
- 14 -
GROUPE MIAGE Pr Hammoucha Yassine
La «fréquence relative» ou «fréquence» fi est la proportion d’individus présentant
la même modalité dans la population
La «fréquence» fi est obtenue en divisant chaque effectif par l’effectif total
La «fréquence» fi peut être exprimée en pourcentage%
La somme des fréquences relatives i est égale à 1 et a somme des fréquences
Dé
f l
exprimées en % est égale à 100
monstration
L atistique initiale se présen sous la forme suivante :
e tableau st tera
Exemple d’application : Compléter le tableau en calculant les fréquences relatives et les
fréquences en pourcentages ?
Nombre d’enfants par famille
bre d’ amille (xi) Effectif (ni) Fréquence (fi)%
Nom enfants/f
0 3 5.36
1 5 8.92
2 8 14.29
3 7 12.5
4 14 25
5 9 16.08
6 6 10.72
7 2 3.57
8 1 1.78
9 1 1.78
Total 56 100
- 15 -
GROUPE MIAGE Pr Hammoucha Yassine
A.1- Les tableaux à caractères qualitatifs
tableaux à caractères qualitatifs ne posen
Les t pas de problèmes particuliers
1. re à modalités nominales
2. Tableaux de caractère à modalités ordinales
Tableaux de caractè
A.2- Les tableaux à caractères quantitatifs peuvent contenir plus d’informations
que les tableaux à caractères qualitatifs :
Effectifs cumulés
Fréquences cumulées
Les effectifs cumulés notés N(x)
Exemple : Nombre d’enfants par famille : Combien de familles ont plus de
quatre enfants? Combien de familles ont moins de quatre enfants?
Les fréquences cumulées notées F (x)
Exemple1: Répartition des salariés de l’entreprise M selon la CSP au 31/12/06
Les modalités des CSP (xi) Effectifs (ni) fréquences (fi) fi en %
Cadre Supérieur 10 0.071 7.1
Contremaitres 5 0.036 3.6
Employés 30 0.214 21.4
Ouvriers spécialisés 90 0.643 64.3
Autres catégories 5 0.036 3.6
Total 140 1 100
Exemple 2: Répartition des étudiants du groupe A selon leur lieu de naissance
Lieu de naissance (xi) Effectifs (ni) fréquences (fi) fi en %
Casablanca 98 0.392 39.2
Mohammedia 53 0.212 21.2
Rabat 47 0.188 18.8
Kenitra 32 0.128 12.8
Autres 20 0.080 8
Total 250 1 100
Exemple: enquête effectuée auprès d’un éc antillon de 9 étudiants de sciences
économiques sur leur opinion concernant l’architecture de l’institut
Opinion (xi) Effectifs (ni) fréquences (fi) fi en %
h
Très bonne 5 0.556 55.6
Bonne 2 0.222 22.2
Moyenne 1 0.111 11.1
Médiocre 1 0.111 11.1
Total 9 1 100
- 16 -
GROUPE MIAGE Pr Hammoucha Yassine
Q
prop
Le c s effectifs cumulés et des fréquences cumulées se fait en cumulant
(s
uelle est la proportion de familles ayant plus de quatre enfants? Quelle est la
ortion de familles ayant moins de quatre enfants?
alcul de
ommant) les effectifs et les fréquences relatives dans une colonne du tableau
1. Cas de caractères quantitatifs discrets
Exemple: Nombre d’enfants (xi) observés dans un échantillon de 55 familles
- 17 -
GROUPE MIAGE Pr Hammoucha Yassine
2. Cas de caractères quantitatifs continus
Remarque importante
Le calcul des fréquences et des effectifs cumulés n’est pas affecté par l’amplitude des
classes
B- Les tableaux à deux caractères
Une population statistique peut être décrite à l’aide de deux caractères simultanément
B.1- Présentation générale des tableaux de contingence
Il y a 15 ménages dans l’échantillon qui ont «moins de» 3 enfants. On peut dire
aussi qu’il y a 15 ménages dans l’échantillon qui ont «au plus» 2 enfants.
Il y a 40 ménages dans l’échantillon qui ont «plus de» 2 enfants. On peut dire
ages dans l’échantillon qui ont «au moins» 3 enfants
ants
lon ont «plus de» 3 enfants ou «au moins» 4
aussi qu’il y a 40 mén
40% des ménages de l’échantillon ont «moins de» 4 enfants ou «au plus» 3
enf
60% des ménages de l’échantil
enfants
Exemple: Répartition des salaires mensuels d’une entreprise X au 31/12/06
Interprétation des résultats
88% des salariés gagnent moins de 10000 DH par mois (260 personnes)
80% des salariés de gagnent plus de 9000 DH par mois (235 personnes)
Exemple 1: la population des ménages peut être décrite selon son revenu et ses
dépenses simultanément
ion de la CSP
tion
Exemple 2: la population active marocaine peut être décrite en fonct
et du niveau de forma
Les tableaux statistiques correspondant sont à deux dimensions
Les tableaux de contingence ou croisés dynamiques ou à double entrées
Considérons une population statistique décrite selon deux caractères :
Un caractère X dont les n modalités xisont x1, x2, ..., xi, ...., xn
Un caractère Y dont les k modalités yjsont y1, y2, ..., yj, ...., yk
- 18 -
GROUPE MIAGE Pr Hammoucha Yassine
Le tableau de contingence obéit à une notation conventionnelle
1. Le tableau contient :
Dans la 1ère
colonne les n modalités x1, x2, ..., xi, ...., xn du caractère X
Dans la 1èreligne les k modalités y1, y2, ..., yj, ...., ykdu caractère Y
2. L’effectif nij correspond à l’intersection d’une ligne i et d’une colonne j
s effectifs de la ième ligne, j=1, ..., K est remplacé par «.»
.j: somme des effectifs de la jème colonne, i=1, ..., n’est remplacé par «.»
tif général marginal de X est noté «ni.»et celui de Y«n.j»
5. L’effectif total du tableau est noté «n..»:il s’agit de l’effectif total de la population
étudiée
Exemple:
L’effectif de la population présentant à la fois la modalité xi et la modalité yj
3. Pour les effectifs marginaux ni. Et n.j, on remplace l’indice qui varie par «.»
ni.: somme de
n
4. L’effec
- 19 -
Répartition des salariés d’une entre
formation
prise X selon le sexe (xi) et le niveau de
(yj)
GROUPE MIAGE Pr Hammoucha Yassine
B.2- Propriétés des tableaux de contingence
a xi et yj étant incompatibles et exhaustives, on peut écrire plusieurs
séries d’égalités
) Les modalités de
Pour yj
Pour xi
L’effectif total de la population n...
Apparaît à l’intersection de la dernière ligne et de la dernière colonne
Est égal à la somme de la dernière ligne ou de la dernière colonne
En remplaçant ni. et n.j par les expressions précédentes, on obtient
b) Les fré
Rappor
*La fréquence partielle des modalités xi, yj est égale à :
quences partielles
t de l’effectif partiel sur l’effectif total
*Proportion d’individus satisfaisant à la fois la modalité xi et la modalité yj
La somme des fréquences partielles est égale à 1
- 20 -
GROUPE MIAGE Pr Hammoucha Yassine
Démonstration
C- Les différentes distributions statistiques
Plusieurs distributions statistiques peuvent être définies dans un tableau à double
entrées
Les distributions marginales
Les distributions conditionnelles
1. Les distributions marginales
Un tableau de contingence compte deux distributions marginales: la distribution
marginale du caractère X et la distribution marginale du caractère Y
C.1.a- La distribution marginale du caractère X
Est composée des modalités du caractère X et des effectifs correspondant quelles que
soit les modalités du caractère Y.
La distribution marginale du caractère X est donnée par le tableau suivant
Exemple: Répartition des salariés d’une entreprise M selon le sexe (xi) et le niveau de
formation (yj)
1.
2. Interpréter les résultats
C lculer f22, f31, f12
a
8% des salariés sont des hommes de niveau Bac + 5
- 21 -
GROUPE MIAGE Pr Hammoucha Yassine
- 22 -
C.1.b - La distribution marginale du caractère Y
Est composée des modalités du caractère Y et des
t les modalités du caractère X
effectifs correspondant quelles que
soi
La fréquence marginale de la modalité yj est égale à :
GROUPE MIAGE Pr Hammoucha Yassine
2. Les distributions conditionnelles
Deux séries de distributions conditionnelles
Celle du caractère X conditionnellement au caractère Y
C.2.a Distributions conditionnelles du caractère X liées par yj, j=1, ..., k
Exemple d’application :Répartition des salariés d’une entreprise
M selon le sexe (xi) et le niveau de formation (yj)
Celle du caractère Y conditionnellement au caractère X
e sont les modalités de X et des effectifs de chacune de ces modalités dans la sous
p
Distribution conditionnelle du caractère X liée par yj (j=1à k) est la suivante :
C
opulation présentant la modalité yj de Y:
Exemple : Répartition de la sous population des femmes de l’entreprise M selon leur
niveau de formation
- 23 -
GROUPE MIAGE Pr Hammoucha Yassine
C.2.b Distributions conditionnelles du caractère Y liées par xi, i=1, ..., n
n conditionnelle du aractère Y liées par xi(i=1, ..., n) est la suivante
Ce sont les modalités de et des effectifs d
Y e chacune de ces modalités dans la sous
population présentant la modalité xi de X
Distributio c
Exemple : Répartition de la sous population de l’entreprise M ayant un niveau de
formation «Bac+3» selon le sexe
- 24 -
Exemple d’application : Répartition des salariés d’une entreprise M selon le sexe
(xi) et le niveau de formation (yj)
GROUPE MIAGE Pr Hammoucha Yassine
- 25 -
3. Relation entre les fréquences marginales et les fréquences conditionnelles
On peut démontrer que le produit des fréquences marginales par les fréquences
conditionnelles est égal aux fréquences partielles
I
Les graphiques permettent de donner une synthèse visuelle de la distribution d’une variable. Ils
apparaissent comme plus «parlants»que les tableaux Ils donnent, au sens propre,
une image des réalités observées
Les représentations graphiques sont spécifiques à un type de variables ou de
caractères.
*Qualitatif : ordinal / nominal
*Quantitatif : discret / continu
1. Représentations des distributions à une dimension
Le choix des représentations graphiques dépend de la nature du caractère statistique
étudié
V- Représentations graphiques
A- Représentations des caractères qualitatifs
Les variables qualitatives peuvent être représentées graphiquement de différentes
manières
Diagrammes en bâtons
Diagrammes en barres (ou en tuyaux d’orgue)
Diagrammes circulaires (ou en camembert ou en secteurs)
A.1 Diagrammes en bâtons
Un diagramme en bâtons est constitué d’une suite de «bâtons»
A chaque modalité xi du caractère, on associe un «bâton» de longueur hi
La longueur hi doit être proportionnelle à la fréquence ou à l’effectif n
es bâtons peuvent être verticaux ou horizontaux
fi
L
GROUPE MIAGE Pr Hammoucha Yassine
A.2 Diagrammes en barres (ou en tuyaux d’orgue)
Même principe que pour les diagrammes en bâtons
Exemple : Répartition des salariés de l’entreprise X selon la CSP
Représenter graphiquement la distribution étudiée
A.3 Diagrammes circulaires (camembert ou secteurs)
Cercle divisé en secteurs représentant l’ensemble de la population
-
- 26 -
GROUPE MIAGE Pr Hammoucha Yassine
- Les différentes modalités du caractères ont représentées par des secteurs dont la
surface est proportionnelle aux effectifs ou fréquences
- L’angle de chaque secteur αi est proportionnel à la fréquence fi: αi= 360 x fi
atifs discrets
B- Représentations des caractères quantitatifs
B.1.Représentation graphique des caractères quantit
Exemple : Répartition des salariés de l’entreprise X selon la CSP
Représenter graphiquement la distribution étudiée
ces cumulées (ou effectifs
bâtons
ibution des fréquences (ou effectifs)
Représentation d’une distribution des fréquen
Représentation d’une distr
cumulés)
Représentation d’une distribution des fréquences (ou effectifs)
Les fréquences (ou effectifs) sont représentées par les diagrammes en
- 27 -
GROUPE MIAGE Pr Hammoucha Yassine
Exemple: Nombre d’enfants des 40 salariés d’une entreprise
Représentation d’une distribution de fréquences cumulées (ou eff. cum.)
*Pour représenter une distribution de fréquences (effectifs) cumulées, il faut d’abord
définir la fonction de répartition F(x)
*Considérons une population statistique décrite selon un caractère quantitatif discret X
dont les n modalités xi sont : x1, x2,..., xi,...., xn
Où x1<x2<xi<...<xn
La fonction de répartition F(x) est définie comme suit:
Distribution des fréquences des salariés selon leur nombre d’enfants
*
Il y
consid
*F(x) représentant les fréquences cumulées «moins de» x:
a plusieurs définitions possibles d’une fonction de répartition F(x) selon que sont
érées les fréquences (effectifs) cumulées «moins de», «plus de»
- 28 -
GROUPE MIAGE Pr Hammoucha Yassine
*F(x) représentant les fréquences cumulées «plus de» x:
*La fonction de répartition F(x) (ou N(x)) est représentée par la courbe
cumulative des fréquences (effectifs)
Représentation graphique de la courbe cumulative croissante
Exemple: Nombre d’enfants des 40 salariés d’une entreprise
- 29 -
GROUPE MIAGE Pr Hammoucha Yassine
Représentation graphique de la courbe cumulative décroissante
B.2.Représentation graphique des caractères quantitatifs continus
Représentation d’une distribution des fréquences (ou effectifs)
Représentation d’une distribution des fréquences cumulées (ou effectifs cumulés)
Représentation d’une distribution de fréquences (ou effectifs)
Les fréquences (ou effectifs) des variables quantitatives continues sont représentées
graphiquement par les histogrammes
- À chaque classe de valeurs, on fait correspondre un rectangle dont l’air est
proportionnelle à la fréquence (ou l’effectif) de chaque classe
- Deux cas de figures doivent être envisagés selon que les amplitudes de classes
sont égales ou inégales
Cas de classes d’amplitudes égales
Sur l’axe des abscisses , sont portées les limites des classes
Sur l’axe des ordonnées, sont portées les fréquences (ou effectifs) correspondant à
chaque classe
Chaque fréquence (ou effectif) est représentée par un rectangle dont la base représente
l’amplitude de classe et dont la hauteur est proportionnelle à la fréquence (ou effectif)
- 30 -
GROUPE MIAGE Pr Hammoucha Yassine
- 31 -
On obtient le polygone des fréquences en joignant les milieux des segments
périeurs de chaque rectangle de l’histogramme.
La propriété fondamentale du polygone des fréquences est qu’il conserve l’aire ou la
rface de l’histogramme.
L’aire comprise entre le polygone des fréquences et l’axe des abscisses est la même
ue l’aire comprise dans l’histogramme
as de classes d’amplitudes inégales
*
su
*
su
*
q
C
Exemple: Salaires des 50 employés de l’entreprise «X» en DH au 31/11/2007
Représentation graphiques des salaires des 50 employés de l’entreprise «X»
L’histogramme ne peut plus être construit exactement de la même manière
Les fréquences (effectifs) se rapportant à des classes d’amplitudes inégales ne
ction se fait en calculant les fréquences (ou effectifs)
sont plus comparables
Il faut dans ce cas effectuer une correction pour tenir compte des
différences d’amplitude
Généralement, la corre
par unité d’amplitude
GROUPE MIAGE Pr Hammoucha Yassine
Sur l’axe des abscisses, sont portées les limites des classes
r l’axe des ordonnées, sont port
Su ées les fréquences (ou effectifs) corrigées
ogramme représente l’amplitude de classe
istogramme est proportionnelle à la
fréquence (ou effectif) corrigée
correspondant à chaque classe
La base de chaque rectangle de l’hist
La hauteur de chaque rectangle de l’h
Représentation d’une distribution de fréquences (ou effectifs) cumulées
F(x)(ou N(x)) dans le cas de caractère
umulative des
Exemple: Salaires des 50 employés de l’entreprise «X» en DH au 31/11/2007
Représentation graphiques des salaires des 50 employés de l’entreprise «X»
La fonction de répartition
quantitatif continu est représentée par la courbe c
fréquences (effectifs)
- 32 -
GROUPE MIAGE Pr Hammoucha Yassine
des caractères quantitatifs continus possèdent
s des fonctions de répartition des caractères dis « La
fonctions de répartition des caractères quantitatifs continus sont
droite
ans
Les fonctions de répartition
toutes les propriété
continuité»
Les
continues à gauche et à
D chaque classe, on fait une interpolation linéaire: on relie les points extrêmes de
haque classe par un segment de droite
c
La courbe cumulative est donc continue
xemple: Salaires des 50 employés de l’entreprise «X» en DH au 31/11/2007
E
Représenter gra
F(x) «moins de» :On prend pour abscisses les limites supérieures des
classes et, pour ordonnées, les fréquences cumulées correspondantes
F(x) «plus de»: On prend pour abscisses les limites inférieures des classes
et, pour ordonnées, les fréquences cumulées correspondantes
eprésentation graphique des courbes cumulatives des fréquences
phiquement les fréquences cumulées
R
- 33 -
GROUPE MIAGE Pr Hammoucha Yassine
2. Représentations des distributions à deux dimensions
es distributions statistiques à deux dimensions peuvent être représentées de
ifférentes manières.
Diagramme en tuyaux d’orgue
Diagramme circulaire
Stéréogramme
Etc.
ctère qualitatif
.1 Représentation graphique des distributions conditionnelles
L
d
A. Cas de cara
Exemple: Répartition des élèves d’une classe selon le sexe et le groupe
Méthode de calcul
Répartition des élèves selon le sexe et le groupe
A
- 34 -
Exemple1: Distributions de la variable GROUPE conditionnellement à la variable SEXE
GROUPE MIAGE Pr Hammoucha Yassine
- 35 -
Diagramme des fréquences de la variable GROUPE conditionnellement à la variable SEXE
E
G
xemple 2: Distributions de la variable SEXE conditionnellement à la variable
ROUPE
Diagramme des fréquences de la variable SEXE conditionnellement à la variable GROUPE
GROUPE MIAGE Pr Hammoucha Yassine
B. Cas de cara
Les dist
graphiquement sous forme de nuage de points dans un plan
Les points sont obtenus en représentant chaque couple d'observation (xi;yi) par un
point dans le plan
ctère quantitatif
ributions statistiques à deux dimensions peuvent être représentées
Exemple 1:Distributions d’un groupe d’étudiants selon les notes de statistique et de
mathématiques
Représentation par nuage de points des étudiants selon leurs notes de statistique et de
mathématiques
- 36 -
GROUPE MIAGE Pr Hammoucha Yassine
On peut remplacer chaque point par un cercle délimitant une aire proportionnelle à
utres représentations graphiques
l'effectif ou à la fréquence
Représentation des étudiants selon leurs notes de stat et de math
A
Stéréogramme
Le stéréogramme permet de faire des représentations 3D
graphiques.
- 37 -
GROUPE MIAGE Pr Hammoucha Yassine
Pyramide des âges
Nous n’avons présenté que les représentations graphiques les plus courantes
Au-delà de cette présentation non exhaustive, il existe des représentations appelées
cartogrammes qui consistent à utiliser des cartes géographiques pour exprimer des
distributions d’individus dans l’espace
Il existe également des graphiques figuratifs où les phénomènes sont représentés par
des objets en rapport avec le caractère étudié (Voiture pour la production de voitures ;
des sacs pour la production de blé, etc.)
V- Caractéristiques de tendance centrale et de position :
• Ici, il s’agit de faire une synthèse de l’information, contenue dans la séri brute, par le
c rale, qui caractérisent
l’
• Dans ce chapitre, on analysera trois de ces paramètres qui sont : les moyennes, le
mode et la médiane.
e
hiffre; et ce en calculant des paramètres dits de tendance cent
ordre de grandeur des observations.
- 38 -
GROUPE MIAGE Pr Hammoucha Yassine
A- Mode
A.1 Définition
Le mode, noté Mo, d’une série statistique est la valeur de cette série, dont l’effectif (ou
la fréquence) est plus grand que les effectifs (ou les fréquences) des valeurs voisines.
Exemple :
A.2 Cas d’un caractère discret
Calculer le mode de la distribution statistique suivante représentant les notes en
statistique d’une classe de 35 élèves :
12-15-14-13-19-20-16-8-9-17-16-15-16-14-7-8-9-12-16-17-13-16-20-16-6-12-14-16-
19-20-16-5-6-14-15
La note qui se répète le plus (08 fois) est 16 qui représente le mode
Exemple
La distribution statistique suivante donne le nombre d’enfants par famille pour un échantillon
de 500 familles.
Nombre d’enfants Nombre de familles
0 50
1 70
2 70
3 50
4 80
5 90
6 et plus 70
Total 500
Représentation graphique des nombre d'enfants par
famille
50 50
90
0
20
40
0
1
2
3
4
5
6
et
Nombre d'enfants
nombre
de
e
70 70
80
70
60
80
famill
100
Nombre de familles
Quel est le mode de cette distribution et quelle est sa signification ?
Le mode
C’est 5 enfants par famille parce que l’effectif correspondant est égal à 90
Cela veut dire qu’il y a 90 familles sur 500 qui ont 5 enfant c’est les familles qu’on rencontre le
plus.
- 39 -
GROUPE MIAGE Pr Hammoucha Yassine
- 40 -
Dans le cas d'une variable statistique discrète. la détermination du mode est immédiate
à partir du tableau statistique ou du diagramme en bâtons.
Ci-dessous on donne trois diagrammes en bâtons associés respectivement, à une
distribution unimodale (qui a un seul mode), et à une distribution bimodale
(qui a deux modes ), et à une distribution qui a un intervalle modal.
A.3 Cas d’un caractère continu
Le mode se trouve dans la classe modale, c'est la classe qui correspond à
l réquence corrigée.
a plus grande f
On peut démontrer que l’expression algébrique du mode est comme suit :
B : est la borne inferie
1 ure de la classe modale
B2 : est l
e
a borne supérieure de la classe modale
n : est l’effectif de la classe modale
en-1 : est l’effectif de la classe qui se trouve avant la classe modale
e l’effectif de la classe qui se trouve après la classe modale
n+1 : est
GROUPE MIAGE Pr Hammoucha Yassine
Exemple
On considère 75 ateliers d’artisans classés en fonction du nombre des heures
travaillées :
Calculez le mode, et interpréter le résultat.
Mo= 130 +(23-15) (150-130)
(23-15)+ (23-17)
Mo= 130 +160
14
Mo= 130 +160=141.42
14
Alors le mode est de 141.42
C’est le nombre fréquent d’heures travaillées dans les 75 ateliers.
B- Médiane
B.1 Définition
La Médiane, notée Me, d’une série statistique, est la valeur de la série qui partage la
population en deux parties d’effectifs égaux. Par conséquent, on aura autant
’observations inférieures à Me que d’observations supérieures à M.
d
B.2 Détermination de la médiane
(a) Cas d’une série brute
Soit la série ordonnée (par ordre croissant) de n observations : x1 , x2 , ..., xn .
, mais on a un
_Si n est impaire, alors la valeur médiane est l’observation qui occupe le rang (n+1)/2.
_Si n est paire, on ne peut plus déterminer exactement la médiane
intervalle médian ( ) [ ]
(b)Cas d’une distribution
Cas d’une Variable Statistique Discrète
Soit X une Variable Statistique Discrète . de distribution Pour déterminer sa
médiane, on utilise les fréquences cumulées croissantes Fi.
Procédure à suivre
Si " i Fi ¹0,5 ; autrement dit, si aucune fréquence cumulée Fi n’est égale à 0,5,
dans ce cas la médiane est la modalité xi qui correspond à la plus petite fréquence
Cumulée dépassant strictement 0,5.
- 41 -
GROUPE MIAGE Pr Hammoucha Yassine
S'il existe une modalité xi pour laquelle Fi = 0,5, dans ce cas on parle d’un
intervalle médian : [xi , xi+1].
Exemple 1 :
Dans le cas continue, la médiane toujours unique : c’est la valeur qui partage
exactement la population deux parties égales. En d'autres termes, Me est la solutio
de l’équation :
Cas d’une Variable Statistique continue
n
Où F est la fonction de répartition de X.
On a deux méthodes pour déterminer la médiane :
(a) Détermination graphique :
-La médiane correspond à l’abscisse du point de la courbe cumulative qui admet pour
ordonnée la valeur 0,5 (ou 50%). (Voir Graphique de l’exemple)
(b) Détermination par interpolation :
-D'après le tableau ou la courbe cumulative, on détermine la classe contenant la
médiane Me ; c’est la classe [ ei-1 , ei [telle que, Fi-1 £ 0,5 < Fi; puis on détermine
Me par interpolation linéaire. donc on a :
Classement des 20 femmes selon le nombre d’enfants
- 42 -
GROUPE MIAGE Pr Hammoucha Yassine
- 43 -
Exemple : Répartition des femmes selon le revenu (en mdhs)
GROUPE MIAGE Pr Hammoucha Yassine
C- Moyenne arithmétique
•(a) Définition :
La moyenne arithmétique, notée , d’une variable statistique X de distribution
Est la quantité :
Où, n est la taille de la population, et les xi sont les modalités dans le cas d'une
variable statistique discrète. et les centres des classes dans le cas d'une variable
statistique continue.
Exemple 1 : On reprend l’exemple des 20 femmes selon le nombre d’enfants
- 44 -
GROUPE MIAGE Pr Hammoucha Yassine
Exemple 2 : Pour les revenus des femmes
Exemple 3 : soit les séries suivantes : répartition selon l’âge
Selon la règle de la moyenne arithmétique
- 45 -
GROUPE MIAGE Pr Hammoucha Yassine
(b) moyenne arithmétique globale
Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes
Respectives
Moyenne globale = moyenne des moyennes
(c)Méthode des simplifications des calculs
Lorsque les calculs sont compliqués, on peut les simplifier en précédant à un
changement de variable Par changement d’échelle : Tout variable Xi peut s’écrire :
X
a= nouvelle échelle Xi= nouvelle variable
Par changement d’origine et d’échelle : tout variable Xi peut s’écrire
i= a X’i
= nouvelle origine a : n.é ’i : n. va
X0 chelle X riable
Exemple
Exemple
- 46 -
GROUPE MIAGE Pr Hammoucha Yassine
Si on pose :
La moyenne arithmétique :
- 47 -
On utilise cette relation pour simplifier les calculs de la manière suivante
On prend pour X0 la valeur de caractère la plus fréquente
O classes sont égaux
n prend « a » l’intervalle des classes lorsque les
Application
l’
: reprenant l’exemple 3 : soit les séries suivantes : répartition selon
âge
Age effictifs
20-25 8
25-30 10
30-35 20
35-40 25
40-45 15
45-50 10
total 88
On calcule :
1- le centre xi de chaque intervalle ex : 20+25/2=22.5
2- on calcul la nouvelle échelle a
Ex : 22.5=2.5+(5*4)
37.5=2.5*(5*6)
De ce fait la n.échelle est a=5
3- Calculez la moyenne avec changement du variable x0 = 37,5 c’est le centre de
classe modale dont l’effectif (25)est le plus élevé la classe (35-40)
Age effectifs xi x’i= (xi-x0)/a ni*x’i
20-25 8 22,5 -24=(-3*8)
25-30 10 27,5 -20= (-2*10)
30-35 20 32,5 -20
35-40 25 37,5 0
40-45 15 42,5 15
45-50 10 47,5
- 3 =(22.5-37.5)/5
-2
-1
0
1
2 20
total 88 -29
GROUPE MIAGE Pr Hammoucha Yassine
D- Moyenne géométrique
(a) Définition :
On appelle moyenne géométrique de la distribution que l’on note G. la
racine niéme
du produit de x ni
i
C’est plus pratique d’utiliser le logarithme
Exemple : Calculer la moyenne géométrique
xi ni
2 1
6 2
10 3
12 2
Total 8
Méthode 1
On utilise a la calculatrice la commande X Y
ou Y X
- 48 -
GROUPE MIAGE Pr Hammoucha Yassine
(b) Domaines d’application :
On utilise la moyenne géométrique dans le calcul du taux d’accroissement moyen et
dans le calcul de certains indices statistiques.
E- Moyenne harmonique
Méthode 2
xi ni Log xi ni log xi
2 1 0..301 0.301
6 2 0.778 1.556
10 3 1 3
12 2 1.079 2.158
Total 8 7.015
On utilise a la calculatrice la commande log x
On utilise a la calculatrice la commande X Y
ou Y X
Définition et propriété :
La moyenne harmonique, notée H, d’une distribution est l’inverse de la
m istribution :
oyenne arithmétique de la d
- 49 -
GROUPE MIAGE Pr Hammoucha Yassine
Domaines d’application
On utilise cette moyenne dans le calcul des durées moyennes, dans le calcul des
moyennes de rapports et de pourcentages et dans les études du pouvoir d’achat
(inverse du MGP)...etc.
F- Moyenne quadratique
éfinition et propriété
D
La moyenne quadratique, notée Q , d’une distribution est l
arrée de la
a racine
moyenne arithmétique de la distribution
c
Exemple : Calculer la moyenne harmonique
xi ni
2 1
6 2
10 3
12 2
Total 8
xi ni fi 1/x ni 1/x fi 1/x
2 1 0.125 0.5 0.5 0,0625
6 2 0.25 0.166 0.332 0,0415
10 3 0.375 0.1 0.3 0,0375
12 2 0.25 0.083 0.166 0,02075
Total 8 1 1,298 0,16225
- 50 -
GROUPE MIAGE Pr Hammoucha Yassine
Domaines d’application
e
:
• La moyenne quadratique intervient dans le calcul de certains paramètres d
dispersion.
G- Quantiles
La détermination des quantiles:
i) Détermination Graphique : elle est pratiquement la même que celle de la
Exemple : Calculer la moyenne quadratique
xi ni
2 1
6 2
10 3
12 2
Total 8
xi ni fi X2
ni X2
fi X2
2 1 0.125 4 4 0.5
6 2 0.25 36 72 9
10 3 0.375 100 300 37.5
12 2 0.25 144 288 36
Total 8 1 664 83
Ou bien
- 51 -
GROUPE MIAGE Pr Hammoucha Yassine
Médiane, il suffit de remplacer 0,5 par α.
ii) Détermination par Interpolation :
Elle correspond à la plus petite fréquence cumulée dépassant
strictement α.
H-
e
E )
Fi%
xemple : On reprend les revenus des 20 femmes (mdhs
Classes ni fi %
[0 ; 35[ 6 30 30
[35 ; 70[ 9 45 75
[70 ; 140[ 5 25 100
TOTAL 20 100
Le choix d’une caractéristique de tendance central
1 : Les conditions de Yule :
- 52 -
GROUPE MIAGE Pr Hammoucha Yassine
1ère conditions : Une modalité caractéristique doit être : définie de façon
doivent trouver le même résultat)
2
5 Doit se prêter au calcul algébrique
2 : Comparaison des différentes cara tiques de tendance centrale
objective. (2 personnes différentes
éme conditions : Tenir compte de toutes les observations
3éme conditions : être facile à comprendre
4éme conditions : être facile à calculer
éme conditions :
ctéris :
La moyenne :
Elle répond par nt au ndition Yule ; pour cela qu’elle est la
caractéristique la tilisée, mais il y a des cas ou il faut lui préférer la médiane
quand elle risque nflu e des va extrêm
La médiane :
Elle ne satisfait p ondi de Yul
leur
itions de Yule, mais il y a des cas ou il est utile, en
VI- Caractéristiques de dispersion :
Introduction
faiteme x co s de c’est
plus u
d’être i encé leurs es.
as les c tions e.
En effet, la valeur de la médiane ne change pas quand on augmente la va
d’une observation qui lui est inférieure
Le mode :
Ne remplit pas les cond
particulier quand on cherche la valeur la plus typique d’une série :
Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure
moyenne, mais va stocker les chaussures les plus vendues.
es paramètres de dispersion servent à mesurer la dispersion des observations
Au tour d'une tendance centrale.
On considère deux catégories de paramètres de dispersion :
• 1- Les écarts simples :
étendue- écart interquantile.
• 2-L'écart-type, la variance et le coefficient de variation.
1- Les écarts simples :
L
A- l’étendue
∆= 3
- 53 -
GROUPE MIAGE Pr Hammoucha Yassine
el que : 25%
des observations lui sont inférieurs et 75% lui sont supérieurs. 25% < ; 75%>
2éme quartile Q2= Me 50% < 50%>
émé quartile Q3= 75%< 25%>
On appelle inter quartile : Q3 – Q1 différence entre 1ér quartile et 3éme quartile.
N.B : Intervalle Inter quartile contient 50% des observations
B-3. Application
Salaires Effectifs fi % Fi%
B
B-1.Définition des quartiles :
- Intervalle inter-quartile
On appelle 1ér quartile Q1 la valeur du caractère t
3
B-2. Définition inter quartile :
10-15 9 11 11
15-20 25 30.5 41.5
20-25 32 39 80.5
25-30 16 19.5 100
Total 82 100
Ecart I. Inter quartile Q3 – Q1 =24,3 - 17,3 = 7DH
Signification : pour 50% des effectifs l’écart Maximum de salaire est de 7 DH
C- L’écart absolu moyen :
C-1 Définition
On appelle écart absolu moyen que l’on désigne par la moyenne arithmétique des
écarts absolus entre les valeurs du caractère et la moyenne arithmétique.
Application :
Quelle est l étendue de la série statistique suivante : 10- 390- 395- 405- 410- 1000
léments de réponse : Etendue = 990
E
C-2 Application
Soit le tableau suivant :
- 54 -
Signification : Ca = 4.42 Kg signifie qu’en moyenne, chaque individu s’éloigne de
la moyenne (67.75 Kg) de 4.42 Kg.
GROUPE MIAGE Pr Hammoucha Yassine
Remarque : Pour dire si une dispersion est grande ou non, pour comparer deux
séries entre elles, on se sert de l’indice de dispersion relatif = Ca / X *100
D - Variance et écart-type
D-1. Définition :
On appelle une variance la moyenne arithmétique des carrés des écarts entre les
valeurs du caractère et la moyenne arithmétique.
On appelle pe (ou écart quadratique moyen) la racine carré de
écart-ty
D
Poids ni xi ni * xi
-2. Application : Le même tableau précédent
ni
55-60 12 57,5 690 -10,25 105,0625 1260,75
60-65 17 62,5 1062,50 -5,25 27,5625 468,5625
65-70 36 67,5 2430 -0,25 ,0625 2,25
0
70-75 24 72,5 1740 4,75 22,5625 541,5
75-80 11 77,5 852,50 9,75 95,0625 1045,6875
Total 100 6775 3318,75
Signification : En moyenne chaque individu s’écarte du poids moyen (67.5 Kg) de
5.76 kg.
- 55 -
GROUPE MIAGE Pr Hammoucha Yassine
E- Coefficient de variation :
C'est un coefficient qui permet de relativiser l'écart type en fonction de la taille des
valeurs. Il permet ainsi de comparer la dispersion de séries de mesures exprimées dans
des unités différentes.
VII- La concentration :
L'objectif est de mesurer les inégalités dans la répartition d'une variable à l'intérieur
d'une population. Cette notion n'a d'intérêt que dans la mesure où les valeurs globales
xi représentent les valeurs ponctuelles ou les centres des classes, ni les effectifs
la sér
-Médiale :
ition :
caractère qui partage la masse
a médiale de la série (xi, gi)
édiane
çant les Fi par les F’i
suivantes ont une signification concrète
A- Valeurs globales
correspondants.
Les valeurs globales de ie (xi , ni) sont les quantités gi = ni xi
B
B-1. Défin
Application : Le même tableau précédent
Poids ni xi gi=ni * xi
55-60 12 57,5 690
60-65 17 62,5 1062,50
65-70 36 67,5 2430
70-75 24 72,5 1740
75-80 11 77,5 852,50
Total 100 6775
La médiale de la série statistique X est la valeur du
globale en deux parties égales. On la note Ml , et on a :
G(Ml) =0,5 =50 %.
La médiane de la série (xi, ni) est l
B-2. Détermination de la médiale
La procédure de la détermination de la médiale est similaire à celle de la m
En rempla
- 56 -
GROUPE MIAGE Pr Hammoucha Yassine
B-3. L’écart absolu médiale- médiane
noté
Application : Le même tableau précédent
Poids ni xi fi% Fi%
cr
gi=ni *
xi
f’i% F’i%
cr
55-60 12 57,5 12 12 690 10.1 10.1
60-65 7
1 62,5 17 29 1062,50 15.7 25.8
65-70 36 67,5 36 65 2430 35.9 61.70
70-75 24 72,5 24 89 1740 25.7 87.4
75-80 11 77,5 11 100 852,50 12.6 100
Total 100 100 6775 100
Me= 65+5(50-29)/36=67,91
Classe médiale 65-70 amplitude a=05
M est un indicateur de concentration
• Si ∆Mr = 0alors M = Ml donc on a une distribution parfaitement égalitaire
• Plus ∆Mr est grand plus la concentration est forte, et inversement.
C- C nce n (ou RENZ
Dans un repère orthonormé, on trace les points de coordonnées (Fi, F’i) et on les
joint par Segments de droite.
• la courbe ainsi obtenue est appelée courbe de co entration ou urbe de
Lorenz.
Application : Le même tableau précédent
&
ourbe de co ntratio de LO )
des
nc co
- 57 -
GROUPE MIAGE Pr Hammoucha Yassine
D- Indice de G
D-1. Définiti
L'indice de concentration ou indice de Gini, que l'on note IC est donné par :
INI
on
A
cr xi cr
pplication : Le même tableau précédent
Poids ni xi fi% Fi% gi=ni * f’i% F’i% fi
55-60 12 57,5 12 12 690 10.1 10.1 0.101 0.012
60-65 17 62,5 17 29 1062,50 15.7 25.8 0.3590 0.061
65-70 36 67,5 36 65 2430 35.9 61.70 0.875 0.315
70-75 24 72,5 24 89 1740 25.7 87.4 1.4910 0.358
75-80 11 77,5 11 100 852,50 12.6 100 1.8740 0.206
Total 100 100 6775 100 0.952
- 58 -
GROUPE MIAGE Pr Hammoucha Yassine
VIII Le ries oubl e régre i ire
r lat )
no able e co c
n dist tion statistique
ne d ution ’obser ff e selon èr
n la taille et l’âge
ents selon le nbre de pièces et superficie
total
- s sé à d e entré s : ssion l néa
(co ré ion
1- tion de t au d ntingen e :
A. u e ribu double
C’est u istrib ou l vation s’e ectu 2 caract es.
EX : Répartition des étudiants selo
Répartition des logem
superficie 10-30 30-50 50-70 70-80
nbr de piece
1 3 1
2 1 14 3 18
3 1 7 4 12
4 10 7 17
5 6 6 6
total 4 16 20 17 57
B. distributi marginales
e sont les distributions relatives à la seul variable X ou Y
- la répartition des logements selon le nombre de pièces (X)
Nbre de pièces (x) Nbre de logement
ons
C
a
1 4
2 18
3 12
4 17
5 6
total 57
Cette distribution qui concerne la seule variable x est appelée distribution marginale
on la tro à la marge du tableau statistique)
peut calc la moyenne de cette distribution, (et sa signification est le nbre de
es moyen ar logement)
oyenne ap lée moy.marginale notée
(car uve
On uler
pièc ne p
M pe
b- la réparti des logements selon la superficie :
superficie y Nbre de logemen
tion
ts
10-30 4
30-50 16
50-70 20
70-80 17
- 59 -
GROUPE MIAGE Pr Hammoucha Yassine
total 57
Cette distribution qui concerne la seule variable ‘ y’ est appelée distribution marginale
on peut calculer la moyenne (qui exprime la surface moy des logements) appllée
moy.marginal notée
C. Les distributions conditionnelles :
On appelle distribution Conditionnelle la distribution ou l’on a posé une condition sur
l’une des variables.
lles relatives au caractère x que
Ex : Réparation de logements de 30-50m
Cette distribution est appelée Distribution Conditionnelle parce que l’on ne s’intéresse
qu’aux logements qui satisfont la condition de surface 30-50 m2.
On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pièces
des logts de 30-50 m2) on appelle cette moyenne : moyenne conditionnelle.
Dans cet exercice on calcule
ns conditionne
Remarque il existe autant de distributio
le caractère y a de modalités
2- généralisation du tableau de contingences :
x y Y1 Y2 ………. Yj ………. Ym total
X X X
11 12 ………. X1j
1 ………. X1m X1.
X2 X21 … ………. X2j ………. X2m X2.
… … ………. … ………. … …
Xi Xi1 Xi2 ………. Xij ………. Xim Xi.
… … … ………. … ………. … …
Xk Xk1 Xk2 ………. Xkj ………. Xkm Xk.
total x.1 x.2 ………. x.j ………. x.m x..
x1 x2 . . . xk = les modalités de x
1 y2 . . . yk = les modalités de y
y
x1 .effectifs pour la 1ére modalités de x et pour toutes les modalités de y
La distribution marginale de X :
X(xi) Xi.
X1 X1.
X2 X2.
. .
. .
Xi Xi.
Xk Xk.
Total X..
- 60 -
GROUPE MIAGE Pr Hammoucha Yassine
La distribution marginale de y :
Distribution conditionnelle relatif à X et à Y
Dist. Conditionnelle relative à X Dist. Conditionnelle relative à Y
X Xij
X1 X1j
X2 X2j
. .
. .
Xi Xij
Xk Xkj
Total X.j
3- La régression linéaire
A. Présentation du problème :
Soit le tableau suivant :
Ce tableau est un tableau de contingence ou les observations sont connues
individuellement,
On peut présenter plus simplement ce tableau de la manière suivante :
y Xij
y1 Xi1
y2 Xi2
. .
. .
yi Xij
ym Xim
Total Xi.
- 61 -
GROUPE MIAGE Pr Hammoucha Yassine
Nous avons un ensemble de points « un nuage statistique »qui nous indique que les
prix estles quantités évoluent selon la même tendance.
i sont inconnus et qu’il
de régression
ssion c’est le fait de relier y à x par une fonction
Calcule des paramètres de la droite de régression :
B. la méthode des moindres carrés
Il est possible de schématiser ce nuage :
-Par une fonction simple : la fonction linéaire (Droite) qu
faudra trouver.
a=pente de droite
b=ordonnée à l’origine
Une telle droite est appelée droite de régression D(x)
fficient
A=coe
a régre
L
Notion de moindres carrés :
Partons d’un nuage statistique théorique :
- 62 -
GROUPE MIAGE Pr Hammoucha Yassine
C. Calcul des paramètres de la droite de régression.
- 63 -
GROUPE MIAGE Pr Hammoucha Yassine
- 64 -
GROUPE MIAGE Pr Hammoucha Yassine
ans le paragraphe précédent, nous avions estimé y en fonction de x, et nous avions
btenu la droite de régression Dy(x)
atistique estimer x en fonction de y, et trouver la droite
de régression Dx(y) lui aura pour équation.
4- la corrélation linéaire :
D
o
On peut pour le même nuage st
Pour toute yi, nous avons une valeur observée xi.
Pour toute yi, nous avons une valeur estimée sur la droite x’i
Pour toute yi, nous avons une erreur d’estimation égale à | xi – x’i |
ve
Dx(y) idéale est tel que : ∑ | xi – x’i | minimum ou encore ∑ (xi – x’i) 2 minimum
En procédant de la même manière que dans le paragraphe précédent, on trou
l’équation de
Dx(y).
- 65 -
GROUPE MIAGE Pr Hammoucha Yassine
- 66 -
GROUPE MIAGE Pr Hammoucha Yassine
Si on appelle coéff de corrélation la Quantité r tel que : r2
= a . a’, on peut écrire :
• Si r = ±1 on a une corrélation parfaite.
• Si r = +1 on a une corrélation parfaite positive.
• Si r = -1 on a une corrélation parfaite.
d les variables varient dans le même sens.
• Si r = 0 = corrélation nulle.
Application : calculer le coefficient de corrélation d’une autre façon (existe-t-il
un lien entre y et x).
Corr. positive : c à
• Si r = -1 = corrélation parfaite négative.
rient en sens inverse.
C à d les deux phénomènes va
Par exemple Prix et Quantité
, e le est d’a
• Si 0 < r < 1 = la corrélation est positive l utant plus forte que l’on se
rapproche de 1.
• Si -1 < r < 0 = la corrélation est négative, et elle est d’autant plus forte que l’on se
rapproche de -1.
- 67 -
GROUPE MIAGE Pr Hammoucha Yassine
On a une très forte corrélation car r = 0.975 tend vers 1
Remarque : lorsqu’on écrit r2
= a. a’ r = racine a .a’, nous avons une expression très
positif. Comment trouver alors le signe d’une corrélation ?
Réponse : le sens de la corrélation est donnée par le signe de a et a’.
• Si a et a’ sont >0 le produit a.a’ >0 : corrélation positive.
• Si a et a’ sont <0 le produit a.a’>0 :corrélation négative.
On peut dire d’une corrélation qu’elle est très satisfaisante à partir 0.86.
On peut dire d’une corrélation qu’elle parfaite à partir de 0.96.
Formule développée
– Autre formule de r :
- 68 -
GROUPE MIAGE Pr Hammoucha Yassine
Si on appelle : covariance de x et de y l’expression :
IX- Analyse Des Séries Chronologiques.
A. Définition :
B. les différentes composantes d’une série chronologique.
1 – Généralités :
Une série chronologique est une série où les observations de la variable sont faites à
des intervalles réguliers de temps.
Soit la série chronologique suivante : Evolution trimestrielle du chiffre d’affaire d’une
entreprise
trimètres 1 2 3 4
1998 120 148 155 120
1999 130 162 169 132
2000 144 178 186 145
2001 157 196 210 160
Représentation graphique de la série :
- 69 -
GROUPE MIAGE Pr Hammoucha Yassine
L’examen d’une série chronologique révèle l’existence de différences composantes :
Un mouvement de tendance longue (à long terme), appelée « trend ».
Un mouvement saisonnier qui est les variations saisonnières.
:
s variations
ge » de la série est appelée Ajustement. Les 2
stement les plus utilisés sont :
A. la méthode des moyennes mobiles :
1
Des variations accidentelles : ce sont des variations imprévisibles dues à des
circonstances exceptionnelles.
C. intérêt d’une analyse d’une série chronologique
L’analyse des séries chronologiques permet de séparer le mouvement de long terme du
mouvement saisonnier, ce qui nous permettra de faire des calculs de prévision.
2 – l’analyse de la tendance longue : « trend »
Déterminer le trend, cela revient à «
saisonnières, cette technique de « lissa
lisser » la série pour éliminer le
méthodes d’aju
La méthode des moyennes mobiles.
L’ajustement analytique.
Elle consiste à diviser un nuage statistique en « sous – nuages » comprenant chacune
(n–1) données du sous nuages précédent, et à remplacer chaque sous nuage par un
point tel que : x’i = médiane des xi – yi = moyenne des valeurs yi
B. Opérations sur les matrices :
– matrices transposées :
2 – L’addition :
- 70 -
GROUPE MIAGE Pr Hammoucha Yassine
3- Multiplication par un réel :
X- Les Probabilités et l’analyse combinatoire
1- Le modèle probabiliste
Voici les premières phrases d'un manuel : "La théorie des probabilités est une science
mathématique étudiant les lois régissant les phénomènes aléatoires. Un phénomène est
aléatoire si, reproduit maintes fois, il se déroule chaque fois un peu différemment, de
sorte que le résultat de l'expérience change d'une fois à l'autre d'une manière aléatoire,
imprévisible."
L'usage même du mot expérience sous-entend que le phénomène aléatoire est observé
t être
hacun
des résultats possibles est observé avec une certaine fréquence dont la valeur se
aléatoire, on note W l'ensemble de tous les résultats
s A, on dit que A est réalisé.
par le biais d'un critère bien défini, et que le résultat de cette observation peu
décrit sans ambiguïté. L'expérience peut aussi être répétée, et on suppose que c
stabilise si on répète l'expérience maintes et "maintes fois". C'est cette "loi" que
présuppose l'existence d'un modèle probabiliste.
Ce premier chapitre est une rapide présentation du cadre formel des modèles
Probabilistes.
A- Evènements
Etant donnée une expérience
possibles de cette expérience.
Un singleton de Ω est appelé évènement élémentaire.
Un sous-ensemble A de Ω est appelé un évènement. Un évènement A est donc un
Ensemble constitué de résultats possibles de l'expérience. Si le résultat d'une
expérience est dan
- 71 -
GROUPE MIAGE Pr Hammoucha Yassine
On tire une boule dans une urne contenant 2 boules blanches, 1 noire, 4 vertes, 5
rouges, et on regarde sa couleur. Si on répète cette expérience, la fréquence avec
B- Loi de probabilité, espace de probabilité
- 72 -
GROUPE MIAGE Pr Hammoucha Yassine
laquelle on obtient une boule rouge se stabilise peu à peu sur une valeur, égale ici à
5/12. On dit couramment qu'on a 5 chances sur 12 de tirer une boule rouge. Dans le
cadre d'un modèle mathématique de cette expérience aléatoire, on dira que
t
L'additivité
'on a 5 chances sur 12 de tirer une boule rouge et 2
ule soit
t seulement que si on tire une boule, on a 100% de
l'évènement "tirer une boule rouge" a la probabilité 5/12. Plus généralement, dans un
modèle probabiliste, chaque évènement est pondéré par un nombre compris entre 0 e
1, sa probabilité. Ces probabilités doivent respecter certaines règles de compatibilité,
naturelles si on les interprète en termes de "nombre de chances sur 100".
est la principale de ces règles. Appliquée à un cas particulier dans notre exemple, elle
exprime simplement que, puisqu
chances sur 12 de tirer une blanche, on a 5+2 chances sur 12 de tirer une bo
rouge soit blanche. L'autre règle di
chances de …tirer une boule…
Définition 1 Soit Ω un ensemble. Une loi de probabilité P sur Ω est une fonction qui à
tout évènement A associe un nombre réel P(A), et qui a les trois propriétés :
Exemple 1 : On lance un dé et on observe la face du dessus. On posera :
et on supposera que le dé est parfaitement équilibré, de sorte que la probabilité d
chaque face est la même :
e
Remarquo le en utilisant la
propriété des trois
ensemble
ns qu'alors, la probabilité de tout évènement est calculab
c) de la définition. Par exemple, comme {1, 3, 4} est la réunion
s 2 à 2 incompatibles {1}, {3} et {4}, on a :
Plus généralement, soit Ω un ensemble fini :
Définir une loi de probabilité P sur Ω revient à se donner n réels positifs ou nuls p1,
p2, ...., pn tels que et à poser, pour tout indice k, P({wk}) = pk. La loi de
probabilité sur Ω est alors complètement déterminée car, étant donné un évènement
osent A.
A, P(A) est calculable en additionnant les probabilités pk de chacun des évènements
élémentaires {wk} qui comp
- 73 -
GROUPE MIAGE Pr Hammoucha Yassine
Il en est de même si Ω est un ensemble dénombrable, les sommes finies sont alors
remplacées par les sommes de séries.
Exercice 2 : Soit (Ω, P) un espace de probabilité. Répondre aux questions en utilisant la
définition 1 :
a) Si A est un évènement de probabilité P(A) connue, que vaut P(Ac) ?
et P(B).
Montrer que P(A ou B) £ P(A)+P(B). Généraliser cette inégalité à un nombre fini
d'évènements.
On pourrait aussi démontrer les propriétés suivantes :
b) Si A B, comparer P(A) et P(B).
c) Calculer P (A ou B) en fonction de P(A et B), P(A)
d)
C- Le cas où les évènements élémentaires sont équiprobables
Soit (W, P) un espace de probabilité correspondant à une expérience aléatoire dont
l'ensemble des résultats possibles est fini :
Supposons que chaque résultat "a autant de chances d'être réalisé qu'un autre", soit, en
termes probabilistes, que P est telle que :
Comme la somme de ces n nombres est 1, leur valeur commune est égale à 1/n . Soit
maintenant un évènement A. Sa probabilité est :
Cette loi de probabilité est souvent appelée loi uniforme sur Ω. Calculer des
ient donc à dénombrer des
e sait pas lire prend les 6 jetons d'un jeu de
osaient le mot "CARTON". Il réaligne ces jetons au hasard. Avec
ecompose-t-il ce mot ? Même question s'il a pris les 8 jetons qui
ot "INSTITUT".
p
e
robabilités par une méthode directe dans ce cas rev
nsembles.
Exercice 3 : Un jeune enfant qui n
Scrabble qui comp
quelle probabilité r
composaient le m
- 74 -
GROUPE MIAGE Pr Hammoucha Yassine
Exercice 4 : 20 sujets sont au programme d'un oral d'examen. Le candidat tire au sort
3 de ces sujets et traite l'un de ces trois. Combien doit-il avoir révisé de sujets pour
avoir au moins 9 chances sur 10 de pouvoir traiter un sujet qu'il a révisé ?
Remarque sur le choix du modèle probabiliste
Comme dans tout problème de modélisation, il n'y a pas d'automatisme qui permette
reprenons l'exemple de l'urne
introduisant le paragraphe 2. Deux modèles peuvent être considérés comme naturels :
- On peut distinguer les 12 boules contenues dans l'urne en posant :
d'associer un espace de probabilité à une expérience aléatoire "concrète". Même dans
des cas d'école, il n'y a jamais un seul "bon" choix :
D- Exercices
Exercice 5 : Soit (Ω, P) un espace de probabilité, et soient A et B deux évènements.
Montrer que si P(A) = P(B) = 0,9 , alors, P(A B) ≥ 0,8 .
groupe de n personnes, auxquelles on a
b) Avec quelle probabilité sont-ils distants de r places, c'est-à-dire séparés par r-1
personnes. Représenter ces probabilités par un diagramme en bâtons.
Dans le cas général, montrer que P(A B) ≥ P(A)+ P(B) - 1 .
Exercice 6 Deux personnes sont tirées au sort dans un groupe de 30 composés de 10
femmes et 20 hommes. Avec quelle probabilité ces deux personnes sont-elles des
hommes ? Avec quelle probabilité sont-elles des femmes ?
font partie d'un
Exercice 7 Deux amis
distribué au hasard des numéros d'ordre pour constituer une file d'attente.
a) Avec quelle probabilité sont-ils les deux premiers ?
- 75 -
GROUPE MIAGE Pr Hammoucha Yassine
Exercice 8 Un tiroir contient en vrac les 20 chaussettes de 10 paires différentes. On
en sort au hasard 4 chaussettes. Avec quelle probabilité obtient-on :
a) 2 paires b) au moins une paire
2- Probabilités conditionnelles
A- Définition
Lançons un dé parfaitement équilibré. Un bon modèle probabiliste en est donné par :
muni de la loi de probabilité P uniforme.
cette nouvelle expérience, l'évènement A est réalisé quand on obtient un 5, et c'est
Notons A l'évènement "le dé donne au moins 4 points" et B l'évènement "le résultat
est impair". Supposons qu'on ne retienne le résultat du lancer que s'il est dans B. Dans
avec la probabilité relative
Plus généralement la probabilité relative de A sous la
condition que B est réalisé est . On l'appelle aussi probabilité de A sachant
que B, ou probabilité conditionnelle de A relative à B, etc…
Définition : Soit (Ω, P) un espace de probabilité, et soit B un évènement tel que
P(B) ≠ 0. La probabilité de A sachant que B est notée P(A | B), et est définie par :
Exercice 9 : a) Soit B un évènement tel que P(B) ≠ 0. Montrer que l'application qui
à A associe P( A | B ) est une loi de probabilité sur Ω.
0,
b) Donner une propriété de A qui implique P(A | B) = 1, qui implique P(A | B) =
qui implique
Exercice 10 : Un couple a deux enfants. Sous l'une des conditions suivantes :
ants est un garçon,
avec quelle probabilité le couple a-t-il un fils et une fille ?
B- Deux résultats de décomposition
Les deux résultats de ce paragraphe utilisent "à l'envers" la définition 2-1, c'est-à-dire
donnent un moyen de calcul de probabilités connaissant des probabilités conditionnelles.
Ils sont très utiles dans la pratique.
a) l'aîné est un garçon,
b) l'un des enf
Exemple: Une urne contient deux boules blanches et une boule noire. Une personne
tire une boule et la garde, une deuxième personne tire une boule. Avec quelle probabilité
les deux boules tirées sont-elles blanches ? On peut répondre à cette question en utilisant
la définition.
- 76 -
GROUPE MIAGE Pr Hammoucha Yassine
En effet, notons A l'évènement "la première personne a tiré une boule blanche" et B
l'évènement "la deuxième personne a tiré une boule blanche". D'après la définition, P (A
et B) = P (B | A) P(A). Mais P(A) est connue, c'est 2/3. P(B | A) est aussi connue : c'est
ière personne ayant tiré une boule blanche, la deuxième personne tire une
oule au hasard dans une urne qui contient une boule blanche et une boule noire. Ainsi,
P(A et B) vaut (2/3).(1/2) = 1/3 .·
alise
ce procédé de calcul :
Proposition
1/2 car, la prem
b
La proposition suivante, parfois appelé "théorème des probabilités composées", génér
: Soit (Ω, P) un espace de probabilité, et soient A1, A2,…, An des
évènements. On a :
Cet énoncé est constamment utilisé dans le contexte des "chaînes de Markov", qui
Interviennent naturellement dans les problèmes concrets où A1, A2,…, An représente une
succession (temporelle) d'évènements, la probabilité de réalisation du n-ième évènement
An étant conditionnée par "le passé" (probabilité sachant que A1 et … et An-1 ont eu
lieu).
En voici un exemple simple :
Exercice 11: On sait que si le flash d'un appareil photo n'a pas eu panne durant les n
premiers déclenchements (n entier positif ou nul), la probabilité pour qu'il fonctionne au
(n+1)-ième est égale à p (0 < p <1 ).
a) Quel est la probabilité pour qu'il n'ait pas de panne au cours des 100 premiers
déclenchements ?
b) Sachant qu'il a fonctionné n fois, avec quelle probabilité fonctionnera-t-il au moins 100
fois de plus ?
ossibles Ω. En termes ensemblistes, {C1, C2, …, Cn} est
donc une partition de Ω ; en termes probabilistes, on l'appelle un système complet
d’évènements. Soit A un évènement. On a bien sûr :
Soient C1, C2, …, Cn n évènements deux à deux disjoints et dont la réunion est
l'ensemble de tous les résultats p
et en utilisant la définition, on obtient le résultat :
Proposition: Soit (Ω, P) un espace de probabilité, et soit {C1, C2, …, Cn} un système
complet d'évènements. Soit A un évènement. On a :
(Remarquons sans démonstration que ce résultat se généralise à un système complet
INSEE 1994), la population active en
dénombrable d'évènements.)
Exercice 12: En mars 1994 (enquête sur l'emploi
- 77 -
GROUPE MIAGE Pr Hammoucha Yassine
France comprend 44,7% de femmes. Le taux de chômage chez les hommes est 10,8% ; il
est chez les femmes 14,3% . On tire au sort une personne parmi les actifs.
a) Avec quelle probabilité est-elle au chômage ?
b) Sachant qu'elle est au chômage, avec quelle probabilité est-ce une femme ?
C- Evènements indépendants
Définition :
Exercice 13
mpatibles sont-ils indépendants ?
c) Par un diagramme donner un exemple d'évènements A, B, C deux à deux
indépendants
Mais qui ne sont pas indépendants dans leur ensemble.
Remarque
: a) Montrer que si A et B sont indépendants, A et Bc, Ac et B, Ac et Bc
le sont aussi. Généraliser cette remarque au cas d'une famille finie d'évènements
indépendants dans leur ensemble.
b) Deux évènements A et B inco
: Lançons deux dés, chacun parfaitement équilibré. L'ensemble des résultats
Possibles est :
Notons A l'évènement "le premier dé donne 4". Comme le premier dé est
parfaitement équilibré, la probabilité de A est 1/6. Notons B l'évènement "le deuxième
dé donne 6".
Comme le deuxième dé est parfaitement équilibré, la probabilité de A est 1/6. De plus,
nous pouvons sans difficulté supposer
D
que les évènements A et B sont indépendants.
la loi uniforme sur Ω pour représenter l'expérience
odèle
n fois de façon indépendante, on choisira
onc, la probabilité de (A et B), c'est-à-dire de l'évènement élémentaire (4, 6), est égale
à (1/6).(1/6) = 1/36, et de même bien sûr pour tout autre couple (i, j). Ce
e le choix de
raisonnement confirm
aléatoire du lancer de deux dés.
lle probabilité la somme des points
Exercice 14 : On lance deux dés. Avec que
obtenus est-elle égale à 11 ? à 10 ?
ent, considérons une expérience aléatoire dont (Ω, P) est un m
Plus généralem
probabiliste. Si cette expérience est répétée
- 78 -
GROUPE MIAGE Pr Hammoucha Yassine
comme ensemble de résultats ~Ω = Ωn , qu'on munira de la probabilité produit ~P, c'est
à- dire telle que, quels que soient les sous-ensembles A1, A2,…, An de Ω :
D- Exercices
Exercice 15 : Avec quelle probabilité une famille de 3 enfants comporte-t-elle au
moins un garçon ?
Exercice 16 : Dans un groupe de 20 personnes, quelle est la probabilité pour qu'il n'y
ait jamais plus d'un anniversaire par jour ? Et dans un groupe de 50 personnes ? (on
fera comme si toutes les années avaient 365 jours).
Exercice 17 : Une expérience est conduite pour étudier la mémoire des rats. Un rat est
mis devant trois couloirs. Au bout de l'un d'eux se trouve de la nourriture qu'il aime,
au bout des deux autres, il reçoit une décharge électrique. Cette expérience élémentaire
est répétée jusqu'à ce que le rat trouve le bon couloir. Sous chacune des hypothèses
s
enir des expériences antérieures,
abilité la première tentative réussie est-elle la k-ième ? Représenter
graphiquement les réponses.
Exercice 18 : Pour décider d'un traitement thérapeutique, on utilise un test qui est
positif 99 fois sur 100 si une personne est effectivement malade. Mais si une personne
n'est pas malade, le test est positif une fois sur 100. On sait par ailleurs que 5
personnes sur 100 ont cette maladie.
a) Si le test d'une personne est positif, avec quelle probabilité cette personne est-elle
effectivement malade ?
b) Si le test d'une personne est négatif, avec quelle probabilité cette personne n'est-elle
effectivement pas malade ?
Calculer ces probabilités quand on sait que 5 personnes sur 1000 ont cette maladie.
Exercice 19 : La probabilité de fermeture du relai i des circuits décrits ci-dessous est
pi.
B ?
uivantes :
(H1) le rat n'a aucun souv
(H2) le rat se souvient de l'expérience immédiatement précédente,
(H3) le rat se souvient des deux expériences précédentes,
avec quelle prob
Tous les relais
est la probabilit
fonctionnent indépendamment. Dans chacun des cas suivants, quelle
é pour que le courant passe entre A et
a) A et B sont séparés par n relais reliés en série.
b) A et B sont séparés par n relais reliés en parallèle.
c)
- 79 -
GROUPE MIAGE Pr Hammoucha Yassine
d)
Exercice 20 : On transmet un message composé de n symboles binaires '0' ou '1'. Lors de
la transmission, chaque symbole est perturbé avec la probabilité p et se transforme alors
en symbole opposé. Par précaution, le message est transmis deux fois. Si les deux
messages transmis coïncident, l'information est considérée comme correcte.
a) Avec quelle probabilité le i-ième symbole du premier message transmis est-il identique
robabilité les deux messages transmis sont-ils identiques ?
c) Trouver la probabilité pour que, malgré la coïncidence des deux messages,
l'information s'avère erronée. (Application numérique : n = 100 p = 0,001).
Exercice 21 : Un candidat d'un jeu télévisé américain est face à trois portes. Derrière
l'une d'elles se trouve le prix, - une voiture -. Le candidat se place devant la porte de son
choix. Le présentateur de l'émission, qui lui sait où se trouve la voiture, ouvre alors l'une
des deux autres portes et indique au candidat que la voiture ne s'y trouve pas. Le candidat
peut à son tour ouvrir une porte. S'il découvre la voiture, il la gagne.
Un candidat décide d'adopter l'une des trois stratégies suivantes :
a) ouvrir la porte devant laquelle il s'est placé à l'issu de son premier choix,
b) ouvrir l'autre porte,
c) tirer à pile ou face et, s'il obtient pile, ouvrir la porte devant laquelle il s'est placé à
l'issu de son premier choix, ouvrir l'autre porte s'il obtient face.
L'une de ces trois stratégies est-elle préférable aux autres ?
X
A
Dans beaucoup de situations, le détail du résultat d'une expérience aléatoire ne nous
intéresse pas, mais seulement une valeur numérique fonction de ce résultat. Par
exemple, on peut se demander quel est le nombre de pannes d'un ordinateur sur une
du lancer des deux dés :
au i-ième symbole du deuxième message transmis ?
b) Avec quelle p
I- Les variables aléatoires
1- Généralités
- Définitions
durée d'un an, sans être intéressé par les dates auxquelles ont lieu ces pannes. Etudions
un exemple plus simple :
Exemple: On lance deux dés, et on regarde la somme des points obtenus. On choisit
pour modèle probabiliste
- 80 -
GROUPE MIAGE Pr Hammoucha Yassine
muni de la loi de probabilité P uniforme, qui affecte à chaque évènement élémentaire
(i, j) la probabilité P{(i, j)} = 1/36. Avec quelle probabilité la somme des points
obtenus est elle égale, par exemple, à 5 ? C'est la probabilité de l'ensemble des
évènements élémentaires (i, j) qui réalisent cette condition.
par :
La question posée est le calcul de la probabilité de l'évènement { (i, j)∈Ω / S(i, j) = 5
},c'est-à-dire de l'évènement { (1, 4), (2, 3), (3, 2), (4, 1) }. On notera cet évènement, de
façon simplifiée, { S = 5 }. On trouve :
Remarquons que S prend ses valeurs dans {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} et que, par
conséquent :
Abordons maintenant le cas général, dans lequel l'ensemble des valeurs prises par une
variable aléatoire n'est pas forcément fini ou dénombrable :
Définition: On appelle variable aléatoire une application X définie sur un espace de
probabilité (Ω, P) et à valeurs réelles.
Exercice 22 : Représenter la fonction de répartition de la variable aléatoire S de
l'exemple
Exercice 23 : Soit X une variable aléatoire, e soit F sa fonction de répartition. Pour a et
b réels (a < b), exprimer en fonction de F :
P( X > a ), P( a < X ≤ b ),
P(X < a ) (utiliser la proposition 1-1-b), P( X ≥ a), P( X = a ), P( a ≤ X < b ), …
t
- 81 -
GROUPE MIAGE Pr Hammoucha Yassine
Exercice 24: Soit X une variable aléatoire. On suppose que sa fonction de répartition
F est donnée par :
B- Variables aléatoires discrètes, variables aléatoires à densité
- 82 -
GROUPE MIAGE Pr Hammoucha Yassine
Exercice 25: On fait tourner une aiguille autour d'un axe et on repère la position sur
laquelle elle s'arrête par un angle Θ de [0, 2π[.
a) Quelles valeurs proposer pour P( 0 ≤ Θ < π ), P( π ≤ Θ < 2π ), P( π/2 ≤ Θ < 3π/2 ) ?
Et pour P(Θ∈I) lorsque I est un sous-intervalle de [0, 2π[ ?
b) Peut-on proposer une fonction f qui soit la densité de la loi de Θ ?
Remarquons que si X est une variable aléatoire à densité, la densité f vérifie
nécessairement :
Exercice 26 : Soit X une variable aléatoire à densité f définie par :
Exercice 27 : Reprendre l'exemple de l'exercice 24, et montrer qu'on peut écrire :
où f est une fonction à déterminer.
C- Couples de variables aléatoires
- 83 -
GROUPE MIAGE Pr Hammoucha Yassine
Exercice 28 : Soient (X, Y) un couple de variables aléatoires dont la loi est telle que, si
i et j sont deux entiers tels que
D- Variables aléatoires indépendantes
Définition: Soient X et Y deux variables aléatoires définies sur un espace de probabilité
(Ω, P). On dit qu'elles sont indépendantes si pour tout couple (A, B) de sous
Exercice 29 : a) Soient (X, Y) un couple de variables aléatoires de loi donnée par :
X et Y sont-elles indépendantes ?
b) même question avec les données de l'exercice 28
ercice 30
Ex
- 84 -
GROUPE MIAGE Pr Hammoucha Yassine
Dans le cas général, on montre la proposition :
bles aléatoires définies sur un espace de
FY. X et Y sont indépendantes si et
seulement si, pour tout couple (x, y) de réels :
Proposition 1: Soient X et Y deux varia
probabilité (Ω, P), de fonctions de répartitions FX et
Le résultat suivant est utile :
Enonçons enfin une extension de la définition :
E- Exercices
: On équipe un local souterrain de 5 ampoules électriques. On suppose
ue les durées de vie de ces ampoules sont des variables aléatoires indépendantes, et
e même densité f donnée par :
Exercice 31
q
d
On contrôle l'état des ampoules après 300 heures d'utilisation. Avec quelle probabilité
sont-elles hors d'usage.
: Une boîte contient 5 transistors, dont on sait que 3 sont défectueux. On
ste l'un après l'autre les transistors et on les met de côté, jusqu'à avoir trouvé les
éfectueux. On note N1 le nombre de tests effectués pour trouver le premier
deux (exactement) des ampoules
Exercice 32
te
d
- 85 -
GROUPE MIAGE Pr Hammoucha Yassine
transistor défectueux, et N2 le nombre de tests complémentaires effectués pour
ouver le deuxième.
écrire la loi conjointe de N1 et N2.
: Soient X1,…, Xn des variables aléatoires indépendantes et suivant toutes
loi uniforme sur [0, 1]. On pose :
= max (X1,…, Xn)
) Quelle est la fonction de répartition de M ? Quelle est la densité de la loi de M ?
es questions avec min (X1,…, Xn).
- Caractéristiques numériques des variables aléatoires
- Espérance
tr
D
Exercice 33
la
M
a
b) Mêm
2
A
Exercice 34: Quelle est l'espérance de la variable aléatoire qui représente le nombre de
: Quelle est l'espérance de la variable aléatoire de l'exercice 3-4 ?
: Dans chacun des deux cas suivants, calculer E(X), décrire la loi de X2 et
Calculer E(X2) :
points obtenus en lançant un dé ?
Exercice 35
Exercice 36
- 86 -
GROUPE MIAGE Pr Hammoucha Yassine
Exercice 37 : Reprendre les exemples de l'exercice 4-3 et calculer E(X2) en utilisant la
L'énoncé suivant ser r la suite :
éatoires sur un espace de probabilité
proposition 1.
a très utilisé pa
Proposition 2 : Soient X et Y deux variables al
(Ω, P), et soient a et b deux réels. Alors :
Exercice 38 : Montrer la deuxième égalité de cette proposition dans le cas où les lois
s, et on note S la varia eprésente la
somme des points obtenus. Quelle est l'espérance de S ?
de X et Y sont discrètes.
Exercice 39 : On lance deux dé ble aléatoire qui r
B- Variance, covariance
Exemple: Considérons les quatre variables aléatoires :
X1 = 0, c'est-à-dire la variable "aléatoire" constante et nulle
e sur [-1, 1]
X3 de loi uniforme sur [-100, +100]
(T=2000) = P(T=4000) = ¼
pour espérance 0, mais leurs lois sont clairement différentes. Une
tingue est l'étalement, la dispersion, des valeurs qu'elles prennent
,
X2 de loi uniform
X4 telle que P(T=-3000) = 1/2 P
Elles ont toutes quatre
caractéristique qui les dis
autour de leur valeur moyenne E(Xi) = 0. Une façon de mesurer cette dispersion est de
regarder la valeur moyenne de la distance entre Xi et E(Xi). Pour des raisons pratiques, on
- 87 -
GROUPE MIAGE Pr Hammoucha Yassine
préfère choisir la valeur moyenn ntre Xi et E(Xi), qu'on appelle
la variance.
Définition
e du carré de la distance e
: Soit X une variable aléatoire sur un espace de probabilité (Ω, P). La variance
ν(X) de X est :
Exercice 40 : Calculer les variances des variables aléatoires Xi de l'exemple Précédent
Exercice 41 : On lance un dé, et aléatoire qui représente le
nombre de points obtenus. Quelle est la variance de X ?
Proposition 3 : Soit X une variable aléatoire.
on note X la variable
Appelle la variable aléatoire centrée réduite associée à X. Le passage de l'une des variables à
l'autre se fait tout simplement par un changement d'origine et d'unité dans l'ensemble
rises par X.
iance d'une variable aléatoire n'est manifestement pas linéaire. De
Exemple 2: Soit par exemp e non nulle, - c'est-à-dire
qui n'est pas presque sûrement constante -. On a :
des valeurs p
L'expression de la var
fait, si X et Y sont deux variables aléatoires sur (Ω, P), en général, la variance de la
somme X+Y n'est pas égale à la somme des variances de X et de Y :
le X une variable aléatoire de varianc
Calculons dans le cas général ν(X+Y). Comme :
- 88 -
GROUPE MIAGE Pr Hammoucha Yassine
Proposition 4 : Soient X et Y deux variables aléatoires sur (Ω, P). Si X et Y sont
indépendantes, alors :
Exercice 42: Démontrer la proposition dans le cas où les lois de X et Y sont discrètes.
Exercice 43 : On lanc qui représente la
somme des points obtenus. Quelle est la variance de S ?
Une caractéristique souvent utilisée en statistiques est un coefficient appelé coefficient de
corrélation de deux variables aléatoires X et Y. C'est par définition, - et si ni X ni Y n'est
presque sûrement constante - :
e deux dés, et on note S la variable aléatoire
- 89 -
GROUPE MIAGE Pr Hammoucha Yassine
C- Exercices
Exercice 44 : Calculer l'espérance et la variance de la variable aléatoire M de l'exercice
33
Exercice 45 : Les transistors fournis par une usine sont défectueux dans la proportion
p. On teste un transistor après l'autre jusqu'à en obtenir un bon. On note N le nombre
de tests effectués. Quelle est la loi de N ? Calculer l'espérance de N.
és fonctionnent. Le procédé de construction des sous-unités est
tel qu'elles sont défect amment les unes des
autres.
i
constituée. Si elle ne marche pas, on la jette, et on recommence jusqu'à obtenir une
bonne machine.
On note : cu le coût de construction d'une sous-unité,
tu le coût du test d'une sous-unité,
tm le coût du test d'une machine,
t on suppose pour simplifier que le coût d'assemblage des unités est nul.
1) On note C le coût de construction d'une bonne machine. Calculer l'espérance de C
dans les deux cas a) et b).
Exercice 46 : Une machine est constituée de n sous-unités identiques. Elle fonctionne
si toutes ses sous-unit
ueuses dans la proportion p, et indépend
Pour construire une machine sans défaut, deux procédés sont envisagés :
a) On construit une sous-unité, on la teste, si elle est bonne, on la monte, sinon, on la
jette, etc… On continue jusqu'à avoir monté les n sous-unités de la machine. On
suppose pour simplifier qu'il n'y a pas de problème de montage. La machine ainsi
construite est donc bonne.
b) On construit et monte sans les tester n sous-unités, et on teste la machine ains
e
3-Variables aléatoires usuelles
ropriétés d es lois con pourra trouver beaucoup
dans la "litté : les loi étriques (exercice 45),
ue, multinomiale, gamma, etc…, et nous en in s d'autres dans la partie
Voici une liste de définitio
classiques
ns et p e quelqu nues. On
d'autres lois
iq
rature" s géom
hypergéométr
"statistiques"
troduiron
de ce cours.
A-
- 90 -
GROUPE MIAGE Pr Hammoucha Yassine
B-
Exercice 47 : On lance 4 fois un dé. On note X le nombre de fois où on obtient 6.
a) Pour k = 0, 1, 2, 3, 4, calculer P(X = k).
b) On note Xi la variable de Bernoulli qui vaut 1 si on tire un 6 au i-ième lancer, 0 si
on ne tire pas 6 à ce lancer. Ecrire X en fonction des Xi , et en déduire la valeur de
E(X) et de n(X).
C- Loi uniforme
Exercice 48: Soit X une variable aléatoire de loi uniforme sur [0, 1].
a) Calculer directement E(X) et n(X).
b) On pose Y = a + (b-a) X . Que valent E(Y) et n(Y) ? Quelle est la loi de Y ? Qu'en
conclut-on ?
D- Loi exponentielle
Si X suit cette loi :
- 91 -
GROUPE MIAGE Pr Hammoucha Yassine
On peut remarquer aussi que pour tout t positif ou nul :
E-
F-
- 92 -
GROUPE MIAGE Pr Hammoucha Yassine
G-Exercices
- 93 -
GROUPE MIAGE Pr Hammoucha Yassine
4-Caractéristiques des lois usuelles
A-Variables aléatoires réelles discrètes
A-Variables aléatoires réelles continues
- 94 -
GROUPE MIAGE Pr Hammoucha Yassine
- 95 -
GROUPE MIAGE Pr Hammoucha Yassine
- 96 -
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive
statistique descriptive

Weitere ähnliche Inhalte

Was ist angesagt?

Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigés
Majid CHADAD
 
Rapport de-stage-1sud-star-auto
Rapport de-stage-1sud-star-autoRapport de-stage-1sud-star-auto
Rapport de-stage-1sud-star-auto
OULAAJEB YOUSSEF
 
S1 mq i - statistique descriptive i - résumés des chapitres
S1   mq i - statistique descriptive i - résumés des chapitresS1   mq i - statistique descriptive i - résumés des chapitres
S1 mq i - statistique descriptive i - résumés des chapitres
Abdeslam ELMOUDEN
 
Statistique descriptive
Statistique descriptiveStatistique descriptive
Statistique descriptive
eninioo
 

Was ist angesagt? (20)

Cours echantillonnage et estimations
Cours echantillonnage et estimationsCours echantillonnage et estimations
Cours echantillonnage et estimations
 
exercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimationexercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimation
 
Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigés
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
Rapport de-stage-1sud-star-auto
Rapport de-stage-1sud-star-autoRapport de-stage-1sud-star-auto
Rapport de-stage-1sud-star-auto
 
S1 mq i - statistique descriptive i - résumés des chapitres
S1   mq i - statistique descriptive i - résumés des chapitresS1   mq i - statistique descriptive i - résumés des chapitres
S1 mq i - statistique descriptive i - résumés des chapitres
 
Calcul des prévisions
Calcul des prévisionsCalcul des prévisions
Calcul des prévisions
 
Methodologie des enquete
Methodologie des enqueteMethodologie des enquete
Methodologie des enquete
 
Rapport Stage Capgemini Otmane DOUIEB
Rapport Stage Capgemini Otmane DOUIEBRapport Stage Capgemini Otmane DOUIEB
Rapport Stage Capgemini Otmane DOUIEB
 
Cours de Gestion des risques
Cours de Gestion des risquesCours de Gestion des risques
Cours de Gestion des risques
 
Statistique descriptive
Statistique descriptiveStatistique descriptive
Statistique descriptive
 
Exercices Flexion Plane Simple
Exercices Flexion Plane SimpleExercices Flexion Plane Simple
Exercices Flexion Plane Simple
 
Cours statistique descriptive
Cours statistique descriptiveCours statistique descriptive
Cours statistique descriptive
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée
 
Management des risques
Management des risquesManagement des risques
Management des risques
 
Exemple de rapport ecrit
Exemple de rapport ecritExemple de rapport ecrit
Exemple de rapport ecrit
 
Rapport de Mémoire Master Recherche
Rapport de Mémoire Master RechercheRapport de Mémoire Master Recherche
Rapport de Mémoire Master Recherche
 
Guide de présentation de la Soutenance
Guide de présentation de la SoutenanceGuide de présentation de la Soutenance
Guide de présentation de la Soutenance
 
les processus VAR et SVAR
les processus VAR et SVAR  les processus VAR et SVAR
les processus VAR et SVAR
 

Ähnlich wie statistique descriptive

Guide de gestion des ressources hmaines
Guide de gestion des ressources hmainesGuide de gestion des ressources hmaines
Guide de gestion des ressources hmaines
OULAAJEB YOUSSEF
 
Marketing de-loffre
Marketing de-loffreMarketing de-loffre
Marketing de-loffre
Omar BE
 
Vaincre le Vol et la fraude
Vaincre le Vol et la fraudeVaincre le Vol et la fraude
Vaincre le Vol et la fraude
REALIZ
 
La boîte à outils de l'Intelligence Economique
La boîte à outils de l'Intelligence EconomiqueLa boîte à outils de l'Intelligence Economique
La boîte à outils de l'Intelligence Economique
Terry ZIMMER
 
Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...
Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...
Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...
POD Maatschappelijke Integratie - SPP Intégration Sociale
 
INFORMATIQUE DES GESTION : MERISE
INFORMATIQUE DES GESTION : MERISE INFORMATIQUE DES GESTION : MERISE
INFORMATIQUE DES GESTION : MERISE
HINDOUSSATI
 

Ähnlich wie statistique descriptive (20)

Mémoire RH : L'intelligence émotionnelle au travail - LABRIDY Quentin
Mémoire RH : L'intelligence émotionnelle au travail - LABRIDY QuentinMémoire RH : L'intelligence émotionnelle au travail - LABRIDY Quentin
Mémoire RH : L'intelligence émotionnelle au travail - LABRIDY Quentin
 
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
 
Cournoyer et lachance (2014). le processus de prise de décision relative à la...
Cournoyer et lachance (2014). le processus de prise de décision relative à la...Cournoyer et lachance (2014). le processus de prise de décision relative à la...
Cournoyer et lachance (2014). le processus de prise de décision relative à la...
 
Benslimane Fseil SRI
Benslimane Fseil SRIBenslimane Fseil SRI
Benslimane Fseil SRI
 
Guide de gestion des ressources hmaines
Guide de gestion des ressources hmainesGuide de gestion des ressources hmaines
Guide de gestion des ressources hmaines
 
GRH_guide_francais IMPORTANT.pdf
GRH_guide_francais IMPORTANT.pdfGRH_guide_francais IMPORTANT.pdf
GRH_guide_francais IMPORTANT.pdf
 
Marketing de-loffre
Marketing de-loffreMarketing de-loffre
Marketing de-loffre
 
essentiels du RH.pdf
essentiels du RH.pdfessentiels du RH.pdf
essentiels du RH.pdf
 
Profil sce-5101-corrige
Profil sce-5101-corrigeProfil sce-5101-corrige
Profil sce-5101-corrige
 
Profil sce-5102-corrige
Profil sce-5102-corrigeProfil sce-5102-corrige
Profil sce-5102-corrige
 
Marketing
MarketingMarketing
Marketing
 
Vaincre le Vol et la fraude
Vaincre le Vol et la fraudeVaincre le Vol et la fraude
Vaincre le Vol et la fraude
 
Facteur re
Facteur reFacteur re
Facteur re
 
73720847 6838-491f-b7df-ac3f144d019f
73720847 6838-491f-b7df-ac3f144d019f73720847 6838-491f-b7df-ac3f144d019f
73720847 6838-491f-b7df-ac3f144d019f
 
6 b marché du travail
6 b   marché du travail6 b   marché du travail
6 b marché du travail
 
cartographie-des-risques-okokok_compress.pdf
cartographie-des-risques-okokok_compress.pdfcartographie-des-risques-okokok_compress.pdf
cartographie-des-risques-okokok_compress.pdf
 
La boîte à outils de l'Intelligence Economique
La boîte à outils de l'Intelligence EconomiqueLa boîte à outils de l'Intelligence Economique
La boîte à outils de l'Intelligence Economique
 
Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...
Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...
Etude des effets de l'instauration de la loi concernant le droit à l'intégrat...
 
Quelles finalités pour l'évaluation des salariés dans l'entreprise ?
Quelles finalités pour l'évaluation des salariés dans l'entreprise ?Quelles finalités pour l'évaluation des salariés dans l'entreprise ?
Quelles finalités pour l'évaluation des salariés dans l'entreprise ?
 
INFORMATIQUE DES GESTION : MERISE
INFORMATIQUE DES GESTION : MERISE INFORMATIQUE DES GESTION : MERISE
INFORMATIQUE DES GESTION : MERISE
 

Mehr von YassineHammoucha

GRH: recrutement, communication, GPEC et formation
GRH:  recrutement, communication, GPEC et formationGRH:  recrutement, communication, GPEC et formation
GRH: recrutement, communication, GPEC et formation
YassineHammoucha
 
GRH: généralité et notions de base
GRH: généralité et notions de baseGRH: généralité et notions de base
GRH: généralité et notions de base
YassineHammoucha
 

Mehr von YassineHammoucha (16)

Marketing; action commerciale; mix
Marketing; action commerciale; mixMarketing; action commerciale; mix
Marketing; action commerciale; mix
 
Mathematiques financieres
Mathematiques financieresMathematiques financieres
Mathematiques financieres
 
Exercices corriges math fin
Exercices corriges math finExercices corriges math fin
Exercices corriges math fin
 
Legislation du travail
Legislation du travailLegislation du travail
Legislation du travail
 
Metier et formation
Metier et formationMetier et formation
Metier et formation
 
Statistiques descrip. et mathe financieres
Statistiques descrip. et  mathe financieresStatistiques descrip. et  mathe financieres
Statistiques descrip. et mathe financieres
 
Entreprise en action
Entreprise en actionEntreprise en action
Entreprise en action
 
Les grandes fonctions de l'entreprise
Les grandes fonctions de l'entrepriseLes grandes fonctions de l'entreprise
Les grandes fonctions de l'entreprise
 
Cycle superieur grh-les pratiques
Cycle superieur grh-les pratiquesCycle superieur grh-les pratiques
Cycle superieur grh-les pratiques
 
Droit des affaires au maroc
Droit des affaires au marocDroit des affaires au maroc
Droit des affaires au maroc
 
Projet de création d'entreprise: exemple
Projet de création d'entreprise: exempleProjet de création d'entreprise: exemple
Projet de création d'entreprise: exemple
 
GRH: recrutement, communication, GPEC et formation
GRH:  recrutement, communication, GPEC et formationGRH:  recrutement, communication, GPEC et formation
GRH: recrutement, communication, GPEC et formation
 
Grh. la motivation des ressources humaines
Grh. la motivation  des ressources humainesGrh. la motivation  des ressources humaines
Grh. la motivation des ressources humaines
 
GRH: généralité et notions de base
GRH: généralité et notions de baseGRH: généralité et notions de base
GRH: généralité et notions de base
 
Gestion des stocks_et_de_la_production
Gestion des stocks_et_de_la_productionGestion des stocks_et_de_la_production
Gestion des stocks_et_de_la_production
 
Cours de merchandising: manuel de formation professionnelle
Cours de merchandising: manuel de formation professionnelle Cours de merchandising: manuel de formation professionnelle
Cours de merchandising: manuel de formation professionnelle
 

statistique descriptive

  • 1. GROUPE MIAGE Pr Hammoucha Yassine - 1 - GROUPE MIAGE Pr Hammoucha Yassine - 1 -
  • 2. GROUPE MIAGE Pr Hammoucha Yassine Sommaire Les statistiques descriptives……………………………………………………...……….…….…....4 I-Terminologie.……………………………………………………......………………….…...…….4 II- Types de critères, de caractères ou de variables……………………..………………….……….6 1.Caractères quantitatifs……………………………………………………….……...…………….6 2. Caractère qualitatif………………………………………..….………...…………...…………….9 En résumé…………………………………………………...…...…………………….………….12 III- Tableaux statistiques……...…...…………...…...………...…...……...…...……………………12 A- les tableaux à un seul caractère……...…...…………...…...………...…...……...….……………14 B- Les tableaux à deux caractères……...…...…………...…...………...…...………………………18 C- Les différentes distributions statistiques……...…...…………...…...………....…………………21 IV- Représentations graphiques……...…...…………...…...………...…...……...…………………25 1. Représentations des distributions à une dimension……...…...…………...…...…...……………25 2.Représentations des distributions à deux dimensions……...…...…………...…...………………34 3.Autres représentations graphiques……...…...…………...…...………...…...……………………37 V- Caractéristiques de tendance centrale et de position……...…...…………...…...………………38 A- Mode……...…...…………...…...………...…...……...…...…………………….………………39 B- Médiane……...…...…………...…...………...…...……...………………....……………………41 C- Moyenne arithmétique……...…...…………...…...………...…...…….........……………………44 D- Moyenne géométrique……...…...…………...…...………...…...……...…......…………………48 E- Moyenne harmonique……...…...…………...…...………...…...……...…...……...….…………49 F- Moyenne quadratique……...…...…………...…...………...…...……...…...……………………50 G- Quantiles……...…...…………...…...………...…...……...…...……………….……...…………51 H- Le choix d’une caractéristique de tendance centrale……...…...…………......…………………52 VI- Caractéristiques de dispersion……...…...…………...…...………...……..……………………53 Introduction……...…...…………...…...………...…...…….........................…...……………………53 Les écarts simples……...…...…………...…...…………...…...…...……...…...……………………53 A- l’étendue……...…...…………...…...………...……………….....……...…...……………………53 B- Intervalle inter-quartile……...…...…………...….....………...…...……...…...……………………54 C- L’écart absolu moyen……...…...…………...…...…………...…...……...…...……………………54 D - Variance et écart-type……...…...…………...…...………...…......……...…...……………………55 E- Coefficient de variation……...…...…………...…...………...….....……...…...……………………56 VII- La concentration……...…...…………...…...………...…...……...……....……………………56 A- Valeurs globales……...…...…………...…...………...…...……...…...………….………………56 B-Médiale……...…...…………...…...………...…...……...…...…………………………………...56 C- Courbe de concentration (ou de LORENZ) ……...…...…………...…...………...……………57 D- Indice de GINI……...…...………..………...…...………...…...……...…...……………………58 VIII- Les séries à double entrées : régression linéaire (corrélation) ……...…...…………...………59 1- notion de tableau de contingence……...…...…………...…...………...…...……………………59 A. une distribution statistique double……...…...…………...…...………...……..……………………59 B. distributions marginales……...…...…………...…...………...…...……...…...……………….……59 C. Les distributions conditionnelles……...…...…………..……...…...……...…...……………………60 2- généralisation du tableau de contingences……...…...…………...…...………...…...……....……60 3- La régression linéaire……...…...…………...…...………...…...……...…...………………..……61 A. Présentation du problème……...…...…………...…...………...…...……...…...………….………61 B. la méthode des moindres carrés……...…...…………...…...………...…...……...…...……….……62 - 2 -
  • 3. GROUPE MIAGE Pr Hammoucha Yassine C. Calcul des paramètres de la droite de régression……...…...…………...…...………....…………….63 4- la corrélation linéaire……...…...…………...…...………...…...…….....…...…………..……...…65 IX- Analyse Des Séries Chronologiques……...…...…………...…...………...……………………69 1 – Généralités……...…...…………...…...………...…...……...….....................……………………69 A. Définition……...…...…………...…...………...…...……...…...…………………………………69 B. les différentes composantes d’une série chronologique……...…...…………...…...………...………69 C. intérêt d’une analyse d’une série chronologique……...…...…………...…...………...…...…………70 2 – l’analyse de la tendance longue : « trend » ……...…...…………...…...………...…...…………70 A. la méthode des moyennes mobiles……...…...…………...…...………...…...…….......……………70 B. Opérations sur les matrices……...…...…………...…...………...…...……...…...…………………70 X- Les Probabilités et l’analyse combinatoire……...…...…………...…...…....……………………71 1- Le modèle probabiliste……...…...…………...…...………...…...……...…...………………...…71 A- Evènements……...…...…………...…...………...…...……...…...………………………….……71 B- Loi de probabilité, espace de probabilité……...…...…………...…...………...……………………72 C- Le cas où les évènements élémentaires sont équiprobables……...…...………...……………………74 D- Exercices……...…...…………...…...………...…...……...….........................……………………75 2- Probabilités conditionnelles……...…...…………...…...………...…...…….……………………76 A- Définition……...…...…………...…...………...…...……...…...…………………………………76 B- Deux résultats de décomposition……...…...…………...…...………...…...…….…………………76 C- Evènements indépendants……...…...…………...…...………...…...……...…....…………………78 D- Exercices……...…...…………...…...………...…...……...………………....……………………79 XI- Les variables aléatoires……...…...…………...…...………...…...……...…...….………………80 1- Généralités……...…...…………...…...………...…...……...…...……………..…………………80 A- Définitions……...…...…………...…...………...…...……...…...………………...………………80 B- Variables aléatoires discrètes, variables aléatoires à densité……...…...…………...…...……..………82 C- Couples de variables aléatoires……...…...…………...…...………...…...……...…...........…………83 D- Variables aléatoires indépendantes……...…...…………...…...………...…..........…………………84 E- Exercices……...…...…………...…...………...…...……...……………….....……………………85 2- Caractéristiques numériques des variables aléatoires….....…………………………...…………86 A- Espérance….....…………………………………………………………………………….……86 B- Variance, covariance……...…...……………....…...………...…...……...…...……………………87 C- Exercices……...…...…………...…...…………………..…...…...……...…...……………………90 3-Variables aléatoires usuelles……...…...…………...…...………...…...……...…...………………90 A- Loi de bernoulli……...…...…………...…...………...…...……...…...……………………...……90 B- Loi Binomiale……...…...…………...…...………...…...……...…...…………………………..…91 C- Loi uniforme……...…...…………...…...………...…...……...…...………………………………91 D- Loi exponentielle……...…...…………...…...………...…...……...…...………………….………91 E- Loi de Poisson……...…...…………...…...………...…...……...…...……………………..………92 F- Loi Normale……...…...…………...…...………...…...……...…...…………………….…………92 G-Exercices……...…...…………...…...………...…...……...…...…………………………..………93 4-Caractéristiques des lois usuelles……...…...…………...…...………...…...……...…....…………94 A-Variables aléatoires réelles discrètes……...…...…………...…...………...…...……..………………94 B-Variables aléatoires réelles continues……...…...…………...…...………...…...……………………94 Exercices corrigés……...…...…………...…...………...…...…………......…...……………………96 Exercices……...…...…………...…...………...…...……...…...………………...…………………141 Bibliographie……...…...…………...…...………...…...……...…...……………………………… - 3 -
  • 4. GROUPE MIAGE Pr Hammoucha Yassine Chapitre I- Les statistiques descriptives I-Terminologie : 1. Statistique : La statistique est une méthode scientifique dont l’objet est de recueillir, d’organiser, de résumer et d’analyser les données d’une enquête, d’une étude o d’une expérience, aussi bien que de tirer les conclusions logiques et de prendre les décisions qui s’imposent à partir des analyses effectuées. Les statistiques se sont des données chiffrées relatives à un phénomène étudié collectés par la statistique. Exemple : des statistiques du chômage. Statistique descriptive: classification des données et leur traitement afin de les rendre utilisables et permettre leur interprétation. 2. Population : Ensemble d'individus définis par une propriété commune donnée. Exemple : *si l’on veut étudier la durée de vie des ampoules électriques fabriquées par une compagnie, la population considérée est l’ensemble de toutes les ampoules fabriquées par cette compagnie. *Age des étudiants de 1 ère année : l’ensemble étudié c’est l’âge. 3. Echantillon : Sous-ensemble de la population. Exemple : pour établir la durée de vie des ampoules électriques produites par une machine, on peut prélever au hasard un certain nombre d’ampoules - un échantillon- parmi toutes les celles produites par cette machine. L’échantillonnage représente l’ensemble des opérations qui ont pour objet de prélever un certain nombre d’individus dans une population donnée. 4. Individu ou unité statistique : Chaque élément de la population ou de l’échantillon. Exemple : dans l’exemple précédant, chaque ampoule constitue un individu ou une unité statistique. 5. La taille : Représente le nombre d’individus d’un échantillon ou d’une population. Elle est symbolisée par « n » dans le cas d’un échantillon et par « N » dans le cas d’une population. 6. Le caractère : - 4 -
  • 5. GROUPE MIAGE Pr Hammoucha Yassine C’est l’aspect particulier que l’on désire étudier. Exemple : concernant un groupe de personnes, on peut s’intéresser à leur âge, leur sexe leur taille… 7. Les modalités : Les différentes manières d’être que peut présenter un caractère. Exemple 1 : le sexe est un caractère qui présente deux modalités : féminin ou masculin Exemple 2 : quant au nombre d’enfants par famille, les modalités de ce caractère peuvent être 0,1, 2,3…,20. 8. Caractère qualitatif : Ses modalités ne s’expriment pas par un nombre Exemple : la religion, le sexe, l’opinion… 9. Caractère quantitatif : Ses modalités sont numériques. Exemple : l’age, la taille, le poids… 10. Caractère quantitatif discret ou discontinu L’ensemble des valeurs que peut prendre le caractère est fini ou dénombrable. Le plus Souvent, ces valeurs sont entières. Exemple :le nombre d’enfant dans une famille, le nombre de téléviseurs par foyer et la pointure des souliers. 11. Caractère quantitatif continu : Le caractère peut prendre théoriquement n’importe quelle valeur dans un intervalle donné de nombres réels. Exemple : la taille d’un individu, le poids… 12. Série statistique : L’ensemble des différentes données associées à un certain nombre d’individus. Exemple : la série suivante résulte d’une courte enquête auprès de quelques personnes pour connaître leur âge : 18 21 19 19 17 22 27 18 18 17 20 20 23 13. Les recensemen s t - 5 -
  • 6. GROUPE MIAGE Pr Hammoucha Yassine Sont des opérations issues du dénombrement, qui consistent à étudier de façon exhaustive et en fonction de plusieurs critères tous les éléments d’une population Ne pas confondre «dénombrement» et «recensement» *Le dénombrement: comptage des individus d’une population *Le recensement: chiffrer les données selon plusieurs aspects (âge, sexe, chiffred’affaires, etc.) Exemple Explicatif Des Notions Importants II- Types de critères, de caractères ou de variables Population urbaine marocaine par groupe d’âge et sexe (en millier) Population: Population urbaine marocaine en 2005 et 2006 Individu: Population urbaine Caractère: Groupe d’âge et sexe 1. Caractères quantitatifs Variables numériques et mesurables exprimant une quantité Exemple: Chiffre d’Affaires d’une entreprise; taux de chômage; taille; PIB, etc Les variables quantitatives peuvent être classées en : a. Variables quantitatives discrètes ou discontinues b. Variables quantitatives continues a. Variable quantitative discrète (discontinue) Elle est représentée par un nombre fini de valeurs (Ex: nombre d’enfant par ménage; nombre d’hospitalisation par patient, etc.) Les modalités de la variable peuvent être traitées mathématiquement (par des opérations mathématiques de base) - 6 -
  • 7. GROUPE MIAGE Pr Hammoucha Yassine Exemple: enquête réalisée auprès de 20 femmes casablancaises nées en 1970 sur le nombre d’enfants qu’elles ont eus Nombre d’enfants/femmes Nombre d’enfants Effectif de femmes 0 1 1 3 2 5 3 5 4 4 5 2 Total 20 b. Variable quantitative continue Elle peut prendre un nombre infini de valeurs dans son intervalle de définition (Ex: taille, revenus, CA, poids, etc.) Il s’agit de grandeurs liées à l’espace(longueur, surface), au temps(âge, durée, vitesse), à la masse(poids, teneur), à la monnaie(salaire, CA) Les variables continues peuvent être regroupées en classe: un individu qui pèse 76,5 Kg sera repéré dans une classe de poids de [76-77] Lorsque les données sont regroupées en classe, il faut définir les extrémités de classe r la «borne inférieure» et la «borne supérieure» des classes I t inclues ou non dans les classes Exemple 1: Il faut précise l faut préciser sans ambiguïté si les valeurs des extrémités son nombre d’enfants par femme [ ignifie que la valeur «2» est inclue dans la classe ue la valeur «4» est exclue de la classe To et une Classe [2 –4 «[2 –» s « –4 [» signifie q us les éléments de la population étudiée (femmes) doivent se retrouver dans une seule classe - 7 -
  • 8. GROUPE MIAGE Pr Hammoucha Yassine Exemple 2: Pour des raisons pratiques, on retient généralement comme extrémités de classes des valeurs «rondes» afin d’effectuer aisément des calculs sur les extrémités de classes plitude des classes et du centre des classes. comme pour le calcul de l’am b.1- L’amplitude de classe L’amplitude de classe=la différence entre la valeur de l’extrémité supérieure et la L’amplitude a d’une classe i sera donnée par la formule suivante : valeur de l’extrémité inférieure Exemple 1: xemple 2: Salaires mensuels des employés d’une entreprise «X» en DH au 31/12/2006 classes de salaires : -De 6000 à moins de 7000 DH: [6000 –7000[ Cette classe comprendra un employé dont le salaire = 6999 ta dis qu’un salarié dont le revenu = 7000 s’en trouvera exclu moins de 9000 DH: [7000 –9000[ DH: [9000 3 n -De7000 à -De9000 à moins de 12 000 –12 000[ L’amplitude ai de la classe [6000 –7000[ E Nombre d’enfants par femme - 8 -
  • 9. GROUPE MIAGE Pr Hammoucha Yassine Exemple 3: b.2- Le centre de classe classe=la moyenne des extrémités de classe L Le centre de e centre c d’une classe i sera donnée par la formule suivante : Exemple 1: Exemple 2: A Ne Pas Oublier Salaires des employés de l’entreprise «X» en DH L’amplitude de la deuxième classe est 2 fois plus grande que celle de la première classe L’amplitude de la troisième classe est 3 fois plus grande que celle de la première classe Cas où les amplitudes sont égales (Nombre d’enfants par femme) Cas de classes d’amplitudes inégales (Salaires des employés de l’entreprise «X» en DH) - 9 -
  • 10. GROUPE MIAGE Pr Hammoucha Yassine 2.Caractère qualitatif: Ne peut faire l’objet d’une mesure car il ne se présente pas sous forme numérique.(Ex: u; section du bac; catégorie socio-professionnelle; etc.) • On ne peut pas effectuer d’opérations arithmétiques sur les caractères qualitatifs Les caractères qualitatifs se déclinent en plusieurs Modalités: Modalités:: les différentes valeurs prises par un caractère qualitatif Exemple 1: la variable«sexe» à deux modalités «Masculin» «Feminin» Exemple 2: la variable «couleurs des yeux» peut prendre comme modalités «Noir» «Brun» «Bleu» «Vert» «Gris» Exemple 3: couleur de pea (on ne peut additionner les couleurs de peau des êtres humains) - 10 - Si la population est décrite selon le caractère «CSP agrégées», les différentes modalités seront
  • 11. GROUPE MIAGE Pr Hammoucha Yassine 2.a- Les mod ent alités d’un caractère qualitatif sont exhaustives et mutuellem incompatibles Exhaustives: à chaque individu doit correspondre une modalité du caractère Exemple: enquête sur l’état matrimonial d’un groupe d’individu modalités du caractère «Etat matrimonial» : Célibataire, Marié, Veuf, Pour satisfaire la condition d’exhaustivité, on doit avoir quatre Divorcé : Un individu ne peut être à la fois «célibataire» et «marié» voir être classé dans une et une seule 2.b- Les modalités d’un caractère qualitatif peuvent être ordinales ou Incompatibles: Chaque individu doit pouvoir être classé dans une seule modalité du caractère Exemple Chaque individu d’un caractère doit pou modalité nominales Les modalités ordinales: peuvent être classées ou hiérarchisées Exemple: Enquête réalisée en 2006 par l’association «Maroc Entrepreneur» sur Pas le degré de satisfaction des marocains ayant vécu à l’étranger et franchi le cap du retour au Maroc - Le Caractère: «Degré de satisfaction» - Les : modalités du Caractère «Satisfait», «Assez Satisfait», «Peu Satisfait», « Satisfait» L Le classement effectué va de l’opinion «Satisfait» à l’opinion « es modalités sont ordinales car on peut les classer : Pas Satisfait» d’une préférence positive à une préférence de plus en plus négative Les modalités ordinales ne peuvent faire l’objet d’aucune opération arithmétique On passe - 11 - Les modalités nominales: ne peuvent pas être classées (hiérarchisées) Exemple: Classement d’un groupe de 15 étudiants selon leur ville de naissance
  • 12. GROUPE MIAGE Pr Hammoucha Yassine Les 4 modalités du caractère «Ville de naissance» sont nominales donc elles ne peuvent faire l’objet d’aucun classement hiérarchique En résumé leaux statistiques : umer les données «brutes» . III- Tab L’un des objectifs de la statistique descriptive est de rés recueillies sur une population dans des tableaux statistiques Avantage: *Présentation des données de façon lisible ne: informations relatives à chaque individu E *En lig *En colonne: critères ou caractères étudiés xemple 1: Enquête d’opinion réalisée auprès de 9 étudiants de premières années TSGE rchitecture yenne"},{" Rime",18,"ES","Bonne"},{"Semlali","Mohammed",19,"G","Médiocre"},{" Salma",17,"S","Trèsbonne"},{"Yacoubi","Karim",18,"L","Trèsbonne"}} umain Données recueillies : nom, prénom, âge, série du bac, opinion sur l’a de l’institut Matrice des données:{{"Alaoui","Fatima",18,"L","Trèsbonne"},{" Samira",17,"S","Bonne"},{"Omrani","Fouad",19,"S","Trèsbonne"},{" Amine",20,"S","Trèsbonne"},{"Rafik","Basma",19,"L","Mo La matrice de données n’est pas lisible pour l’esprit h - 12 -
  • 13. GROUPE MIAGE Pr Hammoucha Yassine n des données dans un tableau Présentatio Tab 1: Résultat de l’enquête effectuée auprès des étudiants de l’institut Exemple 2: Nombre d’enfants par famille observé dans un échantillon de 56 familles enquête auprès d’un échantillon de 56 familles marocaines sur le nombre d’enfant par ménage Données brutes: 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 8 9 Les données brutes ne sont pas lisibles Regroupement des données dans un tableau pour faciliter le traitement et les interprétations - 13 -
  • 14. GROUPE MIAGE Pr Hammoucha Yassine La première colonne du tableau reprend les différentes modalités (xi) prises par la variable ou le caractère nombre d’enfants/ménage La deuxième colonne présente les effectifs (ni) (fréquences absolues): le nombre d’individus correspondant à chaque modalité du caractère haque cas du tableau dénombre les individus considérés comme équivalents face au ion C phénomène étudié L’ensemble des modalités et des effectifs d’un caractère forment une distribut statistique ou une série statistique e doit respecter des principes généraux: ter des intitulés de lignes et de colonnes clairement définis Le tableau doit préciser les unit ndre le mètre avec le mètre carré, le millier avec le million, le Le tableau doit préciser la source nnées sont empruntées à une publication ou à un o Les tableaux statistiques peuvent être à ns À «une dimension» si un seul carac ié (nombre d’enfants/ménage) À «deux dimensions» si l’on retient deux caractères (nombre et sexe des enfants/ménage) La présentation d’un tableau statistiqu Le tableau doit porter un titre précisant son contenu : le phénomène étudié , la façon dont il est étudié ,le lieu, la date, etc. Le tableau doit por és utilisées : ne pas confo DH avec l’Euro, etc. des informations lorsque les do rganisme une ou à plusieurs dimensio tère est étud A- les tableaux à un seul caractère onsidérons une population statistique de n individus décrite selon le caractère x dont C les k modalités sont x1, x2, ..., xi, ...., xk représente le nombre ou «fréquence absolue», présentant La somme des «effectifs partiels» ni est «l’effectif total» n de la ni d’individus, appelé «effectif partiel» la modalité xi population - 14 -
  • 15. GROUPE MIAGE Pr Hammoucha Yassine La «fréquence relative» ou «fréquence» fi est la proportion d’individus présentant la même modalité dans la population La «fréquence» fi est obtenue en divisant chaque effectif par l’effectif total La «fréquence» fi peut être exprimée en pourcentage% La somme des fréquences relatives i est égale à 1 et a somme des fréquences Dé f l exprimées en % est égale à 100 monstration L atistique initiale se présen sous la forme suivante : e tableau st tera Exemple d’application : Compléter le tableau en calculant les fréquences relatives et les fréquences en pourcentages ? Nombre d’enfants par famille bre d’ amille (xi) Effectif (ni) Fréquence (fi)% Nom enfants/f 0 3 5.36 1 5 8.92 2 8 14.29 3 7 12.5 4 14 25 5 9 16.08 6 6 10.72 7 2 3.57 8 1 1.78 9 1 1.78 Total 56 100 - 15 -
  • 16. GROUPE MIAGE Pr Hammoucha Yassine A.1- Les tableaux à caractères qualitatifs tableaux à caractères qualitatifs ne posen Les t pas de problèmes particuliers 1. re à modalités nominales 2. Tableaux de caractère à modalités ordinales Tableaux de caractè A.2- Les tableaux à caractères quantitatifs peuvent contenir plus d’informations que les tableaux à caractères qualitatifs : Effectifs cumulés Fréquences cumulées Les effectifs cumulés notés N(x) Exemple : Nombre d’enfants par famille : Combien de familles ont plus de quatre enfants? Combien de familles ont moins de quatre enfants? Les fréquences cumulées notées F (x) Exemple1: Répartition des salariés de l’entreprise M selon la CSP au 31/12/06 Les modalités des CSP (xi) Effectifs (ni) fréquences (fi) fi en % Cadre Supérieur 10 0.071 7.1 Contremaitres 5 0.036 3.6 Employés 30 0.214 21.4 Ouvriers spécialisés 90 0.643 64.3 Autres catégories 5 0.036 3.6 Total 140 1 100 Exemple 2: Répartition des étudiants du groupe A selon leur lieu de naissance Lieu de naissance (xi) Effectifs (ni) fréquences (fi) fi en % Casablanca 98 0.392 39.2 Mohammedia 53 0.212 21.2 Rabat 47 0.188 18.8 Kenitra 32 0.128 12.8 Autres 20 0.080 8 Total 250 1 100 Exemple: enquête effectuée auprès d’un éc antillon de 9 étudiants de sciences économiques sur leur opinion concernant l’architecture de l’institut Opinion (xi) Effectifs (ni) fréquences (fi) fi en % h Très bonne 5 0.556 55.6 Bonne 2 0.222 22.2 Moyenne 1 0.111 11.1 Médiocre 1 0.111 11.1 Total 9 1 100 - 16 -
  • 17. GROUPE MIAGE Pr Hammoucha Yassine Q prop Le c s effectifs cumulés et des fréquences cumulées se fait en cumulant (s uelle est la proportion de familles ayant plus de quatre enfants? Quelle est la ortion de familles ayant moins de quatre enfants? alcul de ommant) les effectifs et les fréquences relatives dans une colonne du tableau 1. Cas de caractères quantitatifs discrets Exemple: Nombre d’enfants (xi) observés dans un échantillon de 55 familles - 17 -
  • 18. GROUPE MIAGE Pr Hammoucha Yassine 2. Cas de caractères quantitatifs continus Remarque importante Le calcul des fréquences et des effectifs cumulés n’est pas affecté par l’amplitude des classes B- Les tableaux à deux caractères Une population statistique peut être décrite à l’aide de deux caractères simultanément B.1- Présentation générale des tableaux de contingence Il y a 15 ménages dans l’échantillon qui ont «moins de» 3 enfants. On peut dire aussi qu’il y a 15 ménages dans l’échantillon qui ont «au plus» 2 enfants. Il y a 40 ménages dans l’échantillon qui ont «plus de» 2 enfants. On peut dire ages dans l’échantillon qui ont «au moins» 3 enfants ants lon ont «plus de» 3 enfants ou «au moins» 4 aussi qu’il y a 40 mén 40% des ménages de l’échantillon ont «moins de» 4 enfants ou «au plus» 3 enf 60% des ménages de l’échantil enfants Exemple: Répartition des salaires mensuels d’une entreprise X au 31/12/06 Interprétation des résultats 88% des salariés gagnent moins de 10000 DH par mois (260 personnes) 80% des salariés de gagnent plus de 9000 DH par mois (235 personnes) Exemple 1: la population des ménages peut être décrite selon son revenu et ses dépenses simultanément ion de la CSP tion Exemple 2: la population active marocaine peut être décrite en fonct et du niveau de forma Les tableaux statistiques correspondant sont à deux dimensions Les tableaux de contingence ou croisés dynamiques ou à double entrées Considérons une population statistique décrite selon deux caractères : Un caractère X dont les n modalités xisont x1, x2, ..., xi, ...., xn Un caractère Y dont les k modalités yjsont y1, y2, ..., yj, ...., yk - 18 -
  • 19. GROUPE MIAGE Pr Hammoucha Yassine Le tableau de contingence obéit à une notation conventionnelle 1. Le tableau contient : Dans la 1ère colonne les n modalités x1, x2, ..., xi, ...., xn du caractère X Dans la 1èreligne les k modalités y1, y2, ..., yj, ...., ykdu caractère Y 2. L’effectif nij correspond à l’intersection d’une ligne i et d’une colonne j s effectifs de la ième ligne, j=1, ..., K est remplacé par «.» .j: somme des effectifs de la jème colonne, i=1, ..., n’est remplacé par «.» tif général marginal de X est noté «ni.»et celui de Y«n.j» 5. L’effectif total du tableau est noté «n..»:il s’agit de l’effectif total de la population étudiée Exemple: L’effectif de la population présentant à la fois la modalité xi et la modalité yj 3. Pour les effectifs marginaux ni. Et n.j, on remplace l’indice qui varie par «.» ni.: somme de n 4. L’effec - 19 - Répartition des salariés d’une entre formation prise X selon le sexe (xi) et le niveau de (yj)
  • 20. GROUPE MIAGE Pr Hammoucha Yassine B.2- Propriétés des tableaux de contingence a xi et yj étant incompatibles et exhaustives, on peut écrire plusieurs séries d’égalités ) Les modalités de Pour yj Pour xi L’effectif total de la population n... Apparaît à l’intersection de la dernière ligne et de la dernière colonne Est égal à la somme de la dernière ligne ou de la dernière colonne En remplaçant ni. et n.j par les expressions précédentes, on obtient b) Les fré Rappor *La fréquence partielle des modalités xi, yj est égale à : quences partielles t de l’effectif partiel sur l’effectif total *Proportion d’individus satisfaisant à la fois la modalité xi et la modalité yj La somme des fréquences partielles est égale à 1 - 20 -
  • 21. GROUPE MIAGE Pr Hammoucha Yassine Démonstration C- Les différentes distributions statistiques Plusieurs distributions statistiques peuvent être définies dans un tableau à double entrées Les distributions marginales Les distributions conditionnelles 1. Les distributions marginales Un tableau de contingence compte deux distributions marginales: la distribution marginale du caractère X et la distribution marginale du caractère Y C.1.a- La distribution marginale du caractère X Est composée des modalités du caractère X et des effectifs correspondant quelles que soit les modalités du caractère Y. La distribution marginale du caractère X est donnée par le tableau suivant Exemple: Répartition des salariés d’une entreprise M selon le sexe (xi) et le niveau de formation (yj) 1. 2. Interpréter les résultats C lculer f22, f31, f12 a 8% des salariés sont des hommes de niveau Bac + 5 - 21 -
  • 22. GROUPE MIAGE Pr Hammoucha Yassine - 22 - C.1.b - La distribution marginale du caractère Y Est composée des modalités du caractère Y et des t les modalités du caractère X effectifs correspondant quelles que soi La fréquence marginale de la modalité yj est égale à :
  • 23. GROUPE MIAGE Pr Hammoucha Yassine 2. Les distributions conditionnelles Deux séries de distributions conditionnelles Celle du caractère X conditionnellement au caractère Y C.2.a Distributions conditionnelles du caractère X liées par yj, j=1, ..., k Exemple d’application :Répartition des salariés d’une entreprise M selon le sexe (xi) et le niveau de formation (yj) Celle du caractère Y conditionnellement au caractère X e sont les modalités de X et des effectifs de chacune de ces modalités dans la sous p Distribution conditionnelle du caractère X liée par yj (j=1à k) est la suivante : C opulation présentant la modalité yj de Y: Exemple : Répartition de la sous population des femmes de l’entreprise M selon leur niveau de formation - 23 -
  • 24. GROUPE MIAGE Pr Hammoucha Yassine C.2.b Distributions conditionnelles du caractère Y liées par xi, i=1, ..., n n conditionnelle du aractère Y liées par xi(i=1, ..., n) est la suivante Ce sont les modalités de et des effectifs d Y e chacune de ces modalités dans la sous population présentant la modalité xi de X Distributio c Exemple : Répartition de la sous population de l’entreprise M ayant un niveau de formation «Bac+3» selon le sexe - 24 - Exemple d’application : Répartition des salariés d’une entreprise M selon le sexe (xi) et le niveau de formation (yj)
  • 25. GROUPE MIAGE Pr Hammoucha Yassine - 25 - 3. Relation entre les fréquences marginales et les fréquences conditionnelles On peut démontrer que le produit des fréquences marginales par les fréquences conditionnelles est égal aux fréquences partielles I Les graphiques permettent de donner une synthèse visuelle de la distribution d’une variable. Ils apparaissent comme plus «parlants»que les tableaux Ils donnent, au sens propre, une image des réalités observées Les représentations graphiques sont spécifiques à un type de variables ou de caractères. *Qualitatif : ordinal / nominal *Quantitatif : discret / continu 1. Représentations des distributions à une dimension Le choix des représentations graphiques dépend de la nature du caractère statistique étudié V- Représentations graphiques A- Représentations des caractères qualitatifs Les variables qualitatives peuvent être représentées graphiquement de différentes manières Diagrammes en bâtons Diagrammes en barres (ou en tuyaux d’orgue) Diagrammes circulaires (ou en camembert ou en secteurs) A.1 Diagrammes en bâtons Un diagramme en bâtons est constitué d’une suite de «bâtons» A chaque modalité xi du caractère, on associe un «bâton» de longueur hi La longueur hi doit être proportionnelle à la fréquence ou à l’effectif n es bâtons peuvent être verticaux ou horizontaux fi L
  • 26. GROUPE MIAGE Pr Hammoucha Yassine A.2 Diagrammes en barres (ou en tuyaux d’orgue) Même principe que pour les diagrammes en bâtons Exemple : Répartition des salariés de l’entreprise X selon la CSP Représenter graphiquement la distribution étudiée A.3 Diagrammes circulaires (camembert ou secteurs) Cercle divisé en secteurs représentant l’ensemble de la population - - 26 -
  • 27. GROUPE MIAGE Pr Hammoucha Yassine - Les différentes modalités du caractères ont représentées par des secteurs dont la surface est proportionnelle aux effectifs ou fréquences - L’angle de chaque secteur αi est proportionnel à la fréquence fi: αi= 360 x fi atifs discrets B- Représentations des caractères quantitatifs B.1.Représentation graphique des caractères quantit Exemple : Répartition des salariés de l’entreprise X selon la CSP Représenter graphiquement la distribution étudiée ces cumulées (ou effectifs bâtons ibution des fréquences (ou effectifs) Représentation d’une distribution des fréquen Représentation d’une distr cumulés) Représentation d’une distribution des fréquences (ou effectifs) Les fréquences (ou effectifs) sont représentées par les diagrammes en - 27 -
  • 28. GROUPE MIAGE Pr Hammoucha Yassine Exemple: Nombre d’enfants des 40 salariés d’une entreprise Représentation d’une distribution de fréquences cumulées (ou eff. cum.) *Pour représenter une distribution de fréquences (effectifs) cumulées, il faut d’abord définir la fonction de répartition F(x) *Considérons une population statistique décrite selon un caractère quantitatif discret X dont les n modalités xi sont : x1, x2,..., xi,...., xn Où x1<x2<xi<...<xn La fonction de répartition F(x) est définie comme suit: Distribution des fréquences des salariés selon leur nombre d’enfants * Il y consid *F(x) représentant les fréquences cumulées «moins de» x: a plusieurs définitions possibles d’une fonction de répartition F(x) selon que sont érées les fréquences (effectifs) cumulées «moins de», «plus de» - 28 -
  • 29. GROUPE MIAGE Pr Hammoucha Yassine *F(x) représentant les fréquences cumulées «plus de» x: *La fonction de répartition F(x) (ou N(x)) est représentée par la courbe cumulative des fréquences (effectifs) Représentation graphique de la courbe cumulative croissante Exemple: Nombre d’enfants des 40 salariés d’une entreprise - 29 -
  • 30. GROUPE MIAGE Pr Hammoucha Yassine Représentation graphique de la courbe cumulative décroissante B.2.Représentation graphique des caractères quantitatifs continus Représentation d’une distribution des fréquences (ou effectifs) Représentation d’une distribution des fréquences cumulées (ou effectifs cumulés) Représentation d’une distribution de fréquences (ou effectifs) Les fréquences (ou effectifs) des variables quantitatives continues sont représentées graphiquement par les histogrammes - À chaque classe de valeurs, on fait correspondre un rectangle dont l’air est proportionnelle à la fréquence (ou l’effectif) de chaque classe - Deux cas de figures doivent être envisagés selon que les amplitudes de classes sont égales ou inégales Cas de classes d’amplitudes égales Sur l’axe des abscisses , sont portées les limites des classes Sur l’axe des ordonnées, sont portées les fréquences (ou effectifs) correspondant à chaque classe Chaque fréquence (ou effectif) est représentée par un rectangle dont la base représente l’amplitude de classe et dont la hauteur est proportionnelle à la fréquence (ou effectif) - 30 -
  • 31. GROUPE MIAGE Pr Hammoucha Yassine - 31 - On obtient le polygone des fréquences en joignant les milieux des segments périeurs de chaque rectangle de l’histogramme. La propriété fondamentale du polygone des fréquences est qu’il conserve l’aire ou la rface de l’histogramme. L’aire comprise entre le polygone des fréquences et l’axe des abscisses est la même ue l’aire comprise dans l’histogramme as de classes d’amplitudes inégales * su * su * q C Exemple: Salaires des 50 employés de l’entreprise «X» en DH au 31/11/2007 Représentation graphiques des salaires des 50 employés de l’entreprise «X» L’histogramme ne peut plus être construit exactement de la même manière Les fréquences (effectifs) se rapportant à des classes d’amplitudes inégales ne ction se fait en calculant les fréquences (ou effectifs) sont plus comparables Il faut dans ce cas effectuer une correction pour tenir compte des différences d’amplitude Généralement, la corre par unité d’amplitude
  • 32. GROUPE MIAGE Pr Hammoucha Yassine Sur l’axe des abscisses, sont portées les limites des classes r l’axe des ordonnées, sont port Su ées les fréquences (ou effectifs) corrigées ogramme représente l’amplitude de classe istogramme est proportionnelle à la fréquence (ou effectif) corrigée correspondant à chaque classe La base de chaque rectangle de l’hist La hauteur de chaque rectangle de l’h Représentation d’une distribution de fréquences (ou effectifs) cumulées F(x)(ou N(x)) dans le cas de caractère umulative des Exemple: Salaires des 50 employés de l’entreprise «X» en DH au 31/11/2007 Représentation graphiques des salaires des 50 employés de l’entreprise «X» La fonction de répartition quantitatif continu est représentée par la courbe c fréquences (effectifs) - 32 -
  • 33. GROUPE MIAGE Pr Hammoucha Yassine des caractères quantitatifs continus possèdent s des fonctions de répartition des caractères dis « La fonctions de répartition des caractères quantitatifs continus sont droite ans Les fonctions de répartition toutes les propriété continuité» Les continues à gauche et à D chaque classe, on fait une interpolation linéaire: on relie les points extrêmes de haque classe par un segment de droite c La courbe cumulative est donc continue xemple: Salaires des 50 employés de l’entreprise «X» en DH au 31/11/2007 E Représenter gra F(x) «moins de» :On prend pour abscisses les limites supérieures des classes et, pour ordonnées, les fréquences cumulées correspondantes F(x) «plus de»: On prend pour abscisses les limites inférieures des classes et, pour ordonnées, les fréquences cumulées correspondantes eprésentation graphique des courbes cumulatives des fréquences phiquement les fréquences cumulées R - 33 -
  • 34. GROUPE MIAGE Pr Hammoucha Yassine 2. Représentations des distributions à deux dimensions es distributions statistiques à deux dimensions peuvent être représentées de ifférentes manières. Diagramme en tuyaux d’orgue Diagramme circulaire Stéréogramme Etc. ctère qualitatif .1 Représentation graphique des distributions conditionnelles L d A. Cas de cara Exemple: Répartition des élèves d’une classe selon le sexe et le groupe Méthode de calcul Répartition des élèves selon le sexe et le groupe A - 34 - Exemple1: Distributions de la variable GROUPE conditionnellement à la variable SEXE
  • 35. GROUPE MIAGE Pr Hammoucha Yassine - 35 - Diagramme des fréquences de la variable GROUPE conditionnellement à la variable SEXE E G xemple 2: Distributions de la variable SEXE conditionnellement à la variable ROUPE Diagramme des fréquences de la variable SEXE conditionnellement à la variable GROUPE
  • 36. GROUPE MIAGE Pr Hammoucha Yassine B. Cas de cara Les dist graphiquement sous forme de nuage de points dans un plan Les points sont obtenus en représentant chaque couple d'observation (xi;yi) par un point dans le plan ctère quantitatif ributions statistiques à deux dimensions peuvent être représentées Exemple 1:Distributions d’un groupe d’étudiants selon les notes de statistique et de mathématiques Représentation par nuage de points des étudiants selon leurs notes de statistique et de mathématiques - 36 -
  • 37. GROUPE MIAGE Pr Hammoucha Yassine On peut remplacer chaque point par un cercle délimitant une aire proportionnelle à utres représentations graphiques l'effectif ou à la fréquence Représentation des étudiants selon leurs notes de stat et de math A Stéréogramme Le stéréogramme permet de faire des représentations 3D graphiques. - 37 -
  • 38. GROUPE MIAGE Pr Hammoucha Yassine Pyramide des âges Nous n’avons présenté que les représentations graphiques les plus courantes Au-delà de cette présentation non exhaustive, il existe des représentations appelées cartogrammes qui consistent à utiliser des cartes géographiques pour exprimer des distributions d’individus dans l’espace Il existe également des graphiques figuratifs où les phénomènes sont représentés par des objets en rapport avec le caractère étudié (Voiture pour la production de voitures ; des sacs pour la production de blé, etc.) V- Caractéristiques de tendance centrale et de position : • Ici, il s’agit de faire une synthèse de l’information, contenue dans la séri brute, par le c rale, qui caractérisent l’ • Dans ce chapitre, on analysera trois de ces paramètres qui sont : les moyennes, le mode et la médiane. e hiffre; et ce en calculant des paramètres dits de tendance cent ordre de grandeur des observations. - 38 -
  • 39. GROUPE MIAGE Pr Hammoucha Yassine A- Mode A.1 Définition Le mode, noté Mo, d’une série statistique est la valeur de cette série, dont l’effectif (ou la fréquence) est plus grand que les effectifs (ou les fréquences) des valeurs voisines. Exemple : A.2 Cas d’un caractère discret Calculer le mode de la distribution statistique suivante représentant les notes en statistique d’une classe de 35 élèves : 12-15-14-13-19-20-16-8-9-17-16-15-16-14-7-8-9-12-16-17-13-16-20-16-6-12-14-16- 19-20-16-5-6-14-15 La note qui se répète le plus (08 fois) est 16 qui représente le mode Exemple La distribution statistique suivante donne le nombre d’enfants par famille pour un échantillon de 500 familles. Nombre d’enfants Nombre de familles 0 50 1 70 2 70 3 50 4 80 5 90 6 et plus 70 Total 500 Représentation graphique des nombre d'enfants par famille 50 50 90 0 20 40 0 1 2 3 4 5 6 et Nombre d'enfants nombre de e 70 70 80 70 60 80 famill 100 Nombre de familles Quel est le mode de cette distribution et quelle est sa signification ? Le mode C’est 5 enfants par famille parce que l’effectif correspondant est égal à 90 Cela veut dire qu’il y a 90 familles sur 500 qui ont 5 enfant c’est les familles qu’on rencontre le plus. - 39 -
  • 40. GROUPE MIAGE Pr Hammoucha Yassine - 40 - Dans le cas d'une variable statistique discrète. la détermination du mode est immédiate à partir du tableau statistique ou du diagramme en bâtons. Ci-dessous on donne trois diagrammes en bâtons associés respectivement, à une distribution unimodale (qui a un seul mode), et à une distribution bimodale (qui a deux modes ), et à une distribution qui a un intervalle modal. A.3 Cas d’un caractère continu Le mode se trouve dans la classe modale, c'est la classe qui correspond à l réquence corrigée. a plus grande f On peut démontrer que l’expression algébrique du mode est comme suit : B : est la borne inferie 1 ure de la classe modale B2 : est l e a borne supérieure de la classe modale n : est l’effectif de la classe modale en-1 : est l’effectif de la classe qui se trouve avant la classe modale e l’effectif de la classe qui se trouve après la classe modale n+1 : est
  • 41. GROUPE MIAGE Pr Hammoucha Yassine Exemple On considère 75 ateliers d’artisans classés en fonction du nombre des heures travaillées : Calculez le mode, et interpréter le résultat. Mo= 130 +(23-15) (150-130) (23-15)+ (23-17) Mo= 130 +160 14 Mo= 130 +160=141.42 14 Alors le mode est de 141.42 C’est le nombre fréquent d’heures travaillées dans les 75 ateliers. B- Médiane B.1 Définition La Médiane, notée Me, d’une série statistique, est la valeur de la série qui partage la population en deux parties d’effectifs égaux. Par conséquent, on aura autant ’observations inférieures à Me que d’observations supérieures à M. d B.2 Détermination de la médiane (a) Cas d’une série brute Soit la série ordonnée (par ordre croissant) de n observations : x1 , x2 , ..., xn . , mais on a un _Si n est impaire, alors la valeur médiane est l’observation qui occupe le rang (n+1)/2. _Si n est paire, on ne peut plus déterminer exactement la médiane intervalle médian ( ) [ ] (b)Cas d’une distribution Cas d’une Variable Statistique Discrète Soit X une Variable Statistique Discrète . de distribution Pour déterminer sa médiane, on utilise les fréquences cumulées croissantes Fi. Procédure à suivre Si " i Fi ¹0,5 ; autrement dit, si aucune fréquence cumulée Fi n’est égale à 0,5, dans ce cas la médiane est la modalité xi qui correspond à la plus petite fréquence Cumulée dépassant strictement 0,5. - 41 -
  • 42. GROUPE MIAGE Pr Hammoucha Yassine S'il existe une modalité xi pour laquelle Fi = 0,5, dans ce cas on parle d’un intervalle médian : [xi , xi+1]. Exemple 1 : Dans le cas continue, la médiane toujours unique : c’est la valeur qui partage exactement la population deux parties égales. En d'autres termes, Me est la solutio de l’équation : Cas d’une Variable Statistique continue n Où F est la fonction de répartition de X. On a deux méthodes pour déterminer la médiane : (a) Détermination graphique : -La médiane correspond à l’abscisse du point de la courbe cumulative qui admet pour ordonnée la valeur 0,5 (ou 50%). (Voir Graphique de l’exemple) (b) Détermination par interpolation : -D'après le tableau ou la courbe cumulative, on détermine la classe contenant la médiane Me ; c’est la classe [ ei-1 , ei [telle que, Fi-1 £ 0,5 < Fi; puis on détermine Me par interpolation linéaire. donc on a : Classement des 20 femmes selon le nombre d’enfants - 42 -
  • 43. GROUPE MIAGE Pr Hammoucha Yassine - 43 - Exemple : Répartition des femmes selon le revenu (en mdhs)
  • 44. GROUPE MIAGE Pr Hammoucha Yassine C- Moyenne arithmétique •(a) Définition : La moyenne arithmétique, notée , d’une variable statistique X de distribution Est la quantité : Où, n est la taille de la population, et les xi sont les modalités dans le cas d'une variable statistique discrète. et les centres des classes dans le cas d'une variable statistique continue. Exemple 1 : On reprend l’exemple des 20 femmes selon le nombre d’enfants - 44 -
  • 45. GROUPE MIAGE Pr Hammoucha Yassine Exemple 2 : Pour les revenus des femmes Exemple 3 : soit les séries suivantes : répartition selon l’âge Selon la règle de la moyenne arithmétique - 45 -
  • 46. GROUPE MIAGE Pr Hammoucha Yassine (b) moyenne arithmétique globale Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes Respectives Moyenne globale = moyenne des moyennes (c)Méthode des simplifications des calculs Lorsque les calculs sont compliqués, on peut les simplifier en précédant à un changement de variable Par changement d’échelle : Tout variable Xi peut s’écrire : X a= nouvelle échelle Xi= nouvelle variable Par changement d’origine et d’échelle : tout variable Xi peut s’écrire i= a X’i = nouvelle origine a : n.é ’i : n. va X0 chelle X riable Exemple Exemple - 46 -
  • 47. GROUPE MIAGE Pr Hammoucha Yassine Si on pose : La moyenne arithmétique : - 47 - On utilise cette relation pour simplifier les calculs de la manière suivante On prend pour X0 la valeur de caractère la plus fréquente O classes sont égaux n prend « a » l’intervalle des classes lorsque les Application l’ : reprenant l’exemple 3 : soit les séries suivantes : répartition selon âge Age effictifs 20-25 8 25-30 10 30-35 20 35-40 25 40-45 15 45-50 10 total 88 On calcule : 1- le centre xi de chaque intervalle ex : 20+25/2=22.5 2- on calcul la nouvelle échelle a Ex : 22.5=2.5+(5*4) 37.5=2.5*(5*6) De ce fait la n.échelle est a=5 3- Calculez la moyenne avec changement du variable x0 = 37,5 c’est le centre de classe modale dont l’effectif (25)est le plus élevé la classe (35-40) Age effectifs xi x’i= (xi-x0)/a ni*x’i 20-25 8 22,5 -24=(-3*8) 25-30 10 27,5 -20= (-2*10) 30-35 20 32,5 -20 35-40 25 37,5 0 40-45 15 42,5 15 45-50 10 47,5 - 3 =(22.5-37.5)/5 -2 -1 0 1 2 20 total 88 -29
  • 48. GROUPE MIAGE Pr Hammoucha Yassine D- Moyenne géométrique (a) Définition : On appelle moyenne géométrique de la distribution que l’on note G. la racine niéme du produit de x ni i C’est plus pratique d’utiliser le logarithme Exemple : Calculer la moyenne géométrique xi ni 2 1 6 2 10 3 12 2 Total 8 Méthode 1 On utilise a la calculatrice la commande X Y ou Y X - 48 -
  • 49. GROUPE MIAGE Pr Hammoucha Yassine (b) Domaines d’application : On utilise la moyenne géométrique dans le calcul du taux d’accroissement moyen et dans le calcul de certains indices statistiques. E- Moyenne harmonique Méthode 2 xi ni Log xi ni log xi 2 1 0..301 0.301 6 2 0.778 1.556 10 3 1 3 12 2 1.079 2.158 Total 8 7.015 On utilise a la calculatrice la commande log x On utilise a la calculatrice la commande X Y ou Y X Définition et propriété : La moyenne harmonique, notée H, d’une distribution est l’inverse de la m istribution : oyenne arithmétique de la d - 49 -
  • 50. GROUPE MIAGE Pr Hammoucha Yassine Domaines d’application On utilise cette moyenne dans le calcul des durées moyennes, dans le calcul des moyennes de rapports et de pourcentages et dans les études du pouvoir d’achat (inverse du MGP)...etc. F- Moyenne quadratique éfinition et propriété D La moyenne quadratique, notée Q , d’une distribution est l arrée de la a racine moyenne arithmétique de la distribution c Exemple : Calculer la moyenne harmonique xi ni 2 1 6 2 10 3 12 2 Total 8 xi ni fi 1/x ni 1/x fi 1/x 2 1 0.125 0.5 0.5 0,0625 6 2 0.25 0.166 0.332 0,0415 10 3 0.375 0.1 0.3 0,0375 12 2 0.25 0.083 0.166 0,02075 Total 8 1 1,298 0,16225 - 50 -
  • 51. GROUPE MIAGE Pr Hammoucha Yassine Domaines d’application e : • La moyenne quadratique intervient dans le calcul de certains paramètres d dispersion. G- Quantiles La détermination des quantiles: i) Détermination Graphique : elle est pratiquement la même que celle de la Exemple : Calculer la moyenne quadratique xi ni 2 1 6 2 10 3 12 2 Total 8 xi ni fi X2 ni X2 fi X2 2 1 0.125 4 4 0.5 6 2 0.25 36 72 9 10 3 0.375 100 300 37.5 12 2 0.25 144 288 36 Total 8 1 664 83 Ou bien - 51 -
  • 52. GROUPE MIAGE Pr Hammoucha Yassine Médiane, il suffit de remplacer 0,5 par α. ii) Détermination par Interpolation : Elle correspond à la plus petite fréquence cumulée dépassant strictement α. H- e E ) Fi% xemple : On reprend les revenus des 20 femmes (mdhs Classes ni fi % [0 ; 35[ 6 30 30 [35 ; 70[ 9 45 75 [70 ; 140[ 5 25 100 TOTAL 20 100 Le choix d’une caractéristique de tendance central 1 : Les conditions de Yule : - 52 -
  • 53. GROUPE MIAGE Pr Hammoucha Yassine 1ère conditions : Une modalité caractéristique doit être : définie de façon doivent trouver le même résultat) 2 5 Doit se prêter au calcul algébrique 2 : Comparaison des différentes cara tiques de tendance centrale objective. (2 personnes différentes éme conditions : Tenir compte de toutes les observations 3éme conditions : être facile à comprendre 4éme conditions : être facile à calculer éme conditions : ctéris : La moyenne : Elle répond par nt au ndition Yule ; pour cela qu’elle est la caractéristique la tilisée, mais il y a des cas ou il faut lui préférer la médiane quand elle risque nflu e des va extrêm La médiane : Elle ne satisfait p ondi de Yul leur itions de Yule, mais il y a des cas ou il est utile, en VI- Caractéristiques de dispersion : Introduction faiteme x co s de c’est plus u d’être i encé leurs es. as les c tions e. En effet, la valeur de la médiane ne change pas quand on augmente la va d’une observation qui lui est inférieure Le mode : Ne remplit pas les cond particulier quand on cherche la valeur la plus typique d’une série : Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure moyenne, mais va stocker les chaussures les plus vendues. es paramètres de dispersion servent à mesurer la dispersion des observations Au tour d'une tendance centrale. On considère deux catégories de paramètres de dispersion : • 1- Les écarts simples : étendue- écart interquantile. • 2-L'écart-type, la variance et le coefficient de variation. 1- Les écarts simples : L A- l’étendue ∆= 3 - 53 -
  • 54. GROUPE MIAGE Pr Hammoucha Yassine el que : 25% des observations lui sont inférieurs et 75% lui sont supérieurs. 25% < ; 75%> 2éme quartile Q2= Me 50% < 50%> émé quartile Q3= 75%< 25%> On appelle inter quartile : Q3 – Q1 différence entre 1ér quartile et 3éme quartile. N.B : Intervalle Inter quartile contient 50% des observations B-3. Application Salaires Effectifs fi % Fi% B B-1.Définition des quartiles : - Intervalle inter-quartile On appelle 1ér quartile Q1 la valeur du caractère t 3 B-2. Définition inter quartile : 10-15 9 11 11 15-20 25 30.5 41.5 20-25 32 39 80.5 25-30 16 19.5 100 Total 82 100 Ecart I. Inter quartile Q3 – Q1 =24,3 - 17,3 = 7DH Signification : pour 50% des effectifs l’écart Maximum de salaire est de 7 DH C- L’écart absolu moyen : C-1 Définition On appelle écart absolu moyen que l’on désigne par la moyenne arithmétique des écarts absolus entre les valeurs du caractère et la moyenne arithmétique. Application : Quelle est l étendue de la série statistique suivante : 10- 390- 395- 405- 410- 1000 léments de réponse : Etendue = 990 E C-2 Application Soit le tableau suivant : - 54 - Signification : Ca = 4.42 Kg signifie qu’en moyenne, chaque individu s’éloigne de la moyenne (67.75 Kg) de 4.42 Kg.
  • 55. GROUPE MIAGE Pr Hammoucha Yassine Remarque : Pour dire si une dispersion est grande ou non, pour comparer deux séries entre elles, on se sert de l’indice de dispersion relatif = Ca / X *100 D - Variance et écart-type D-1. Définition : On appelle une variance la moyenne arithmétique des carrés des écarts entre les valeurs du caractère et la moyenne arithmétique. On appelle pe (ou écart quadratique moyen) la racine carré de écart-ty D Poids ni xi ni * xi -2. Application : Le même tableau précédent ni 55-60 12 57,5 690 -10,25 105,0625 1260,75 60-65 17 62,5 1062,50 -5,25 27,5625 468,5625 65-70 36 67,5 2430 -0,25 ,0625 2,25 0 70-75 24 72,5 1740 4,75 22,5625 541,5 75-80 11 77,5 852,50 9,75 95,0625 1045,6875 Total 100 6775 3318,75 Signification : En moyenne chaque individu s’écarte du poids moyen (67.5 Kg) de 5.76 kg. - 55 -
  • 56. GROUPE MIAGE Pr Hammoucha Yassine E- Coefficient de variation : C'est un coefficient qui permet de relativiser l'écart type en fonction de la taille des valeurs. Il permet ainsi de comparer la dispersion de séries de mesures exprimées dans des unités différentes. VII- La concentration : L'objectif est de mesurer les inégalités dans la répartition d'une variable à l'intérieur d'une population. Cette notion n'a d'intérêt que dans la mesure où les valeurs globales xi représentent les valeurs ponctuelles ou les centres des classes, ni les effectifs la sér -Médiale : ition : caractère qui partage la masse a médiale de la série (xi, gi) édiane çant les Fi par les F’i suivantes ont une signification concrète A- Valeurs globales correspondants. Les valeurs globales de ie (xi , ni) sont les quantités gi = ni xi B B-1. Défin Application : Le même tableau précédent Poids ni xi gi=ni * xi 55-60 12 57,5 690 60-65 17 62,5 1062,50 65-70 36 67,5 2430 70-75 24 72,5 1740 75-80 11 77,5 852,50 Total 100 6775 La médiale de la série statistique X est la valeur du globale en deux parties égales. On la note Ml , et on a : G(Ml) =0,5 =50 %. La médiane de la série (xi, ni) est l B-2. Détermination de la médiale La procédure de la détermination de la médiale est similaire à celle de la m En rempla - 56 -
  • 57. GROUPE MIAGE Pr Hammoucha Yassine B-3. L’écart absolu médiale- médiane noté Application : Le même tableau précédent Poids ni xi fi% Fi% cr gi=ni * xi f’i% F’i% cr 55-60 12 57,5 12 12 690 10.1 10.1 60-65 7 1 62,5 17 29 1062,50 15.7 25.8 65-70 36 67,5 36 65 2430 35.9 61.70 70-75 24 72,5 24 89 1740 25.7 87.4 75-80 11 77,5 11 100 852,50 12.6 100 Total 100 100 6775 100 Me= 65+5(50-29)/36=67,91 Classe médiale 65-70 amplitude a=05 M est un indicateur de concentration • Si ∆Mr = 0alors M = Ml donc on a une distribution parfaitement égalitaire • Plus ∆Mr est grand plus la concentration est forte, et inversement. C- C nce n (ou RENZ Dans un repère orthonormé, on trace les points de coordonnées (Fi, F’i) et on les joint par Segments de droite. • la courbe ainsi obtenue est appelée courbe de co entration ou urbe de Lorenz. Application : Le même tableau précédent & ourbe de co ntratio de LO ) des nc co - 57 -
  • 58. GROUPE MIAGE Pr Hammoucha Yassine D- Indice de G D-1. Définiti L'indice de concentration ou indice de Gini, que l'on note IC est donné par : INI on A cr xi cr pplication : Le même tableau précédent Poids ni xi fi% Fi% gi=ni * f’i% F’i% fi 55-60 12 57,5 12 12 690 10.1 10.1 0.101 0.012 60-65 17 62,5 17 29 1062,50 15.7 25.8 0.3590 0.061 65-70 36 67,5 36 65 2430 35.9 61.70 0.875 0.315 70-75 24 72,5 24 89 1740 25.7 87.4 1.4910 0.358 75-80 11 77,5 11 100 852,50 12.6 100 1.8740 0.206 Total 100 100 6775 100 0.952 - 58 -
  • 59. GROUPE MIAGE Pr Hammoucha Yassine VIII Le ries oubl e régre i ire r lat ) no able e co c n dist tion statistique ne d ution ’obser ff e selon èr n la taille et l’âge ents selon le nbre de pièces et superficie total - s sé à d e entré s : ssion l néa (co ré ion 1- tion de t au d ntingen e : A. u e ribu double C’est u istrib ou l vation s’e ectu 2 caract es. EX : Répartition des étudiants selo Répartition des logem superficie 10-30 30-50 50-70 70-80 nbr de piece 1 3 1 2 1 14 3 18 3 1 7 4 12 4 10 7 17 5 6 6 6 total 4 16 20 17 57 B. distributi marginales e sont les distributions relatives à la seul variable X ou Y - la répartition des logements selon le nombre de pièces (X) Nbre de pièces (x) Nbre de logement ons C a 1 4 2 18 3 12 4 17 5 6 total 57 Cette distribution qui concerne la seule variable x est appelée distribution marginale on la tro à la marge du tableau statistique) peut calc la moyenne de cette distribution, (et sa signification est le nbre de es moyen ar logement) oyenne ap lée moy.marginale notée (car uve On uler pièc ne p M pe b- la réparti des logements selon la superficie : superficie y Nbre de logemen tion ts 10-30 4 30-50 16 50-70 20 70-80 17 - 59 -
  • 60. GROUPE MIAGE Pr Hammoucha Yassine total 57 Cette distribution qui concerne la seule variable ‘ y’ est appelée distribution marginale on peut calculer la moyenne (qui exprime la surface moy des logements) appllée moy.marginal notée C. Les distributions conditionnelles : On appelle distribution Conditionnelle la distribution ou l’on a posé une condition sur l’une des variables. lles relatives au caractère x que Ex : Réparation de logements de 30-50m Cette distribution est appelée Distribution Conditionnelle parce que l’on ne s’intéresse qu’aux logements qui satisfont la condition de surface 30-50 m2. On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pièces des logts de 30-50 m2) on appelle cette moyenne : moyenne conditionnelle. Dans cet exercice on calcule ns conditionne Remarque il existe autant de distributio le caractère y a de modalités 2- généralisation du tableau de contingences : x y Y1 Y2 ………. Yj ………. Ym total X X X 11 12 ………. X1j 1 ………. X1m X1. X2 X21 … ………. X2j ………. X2m X2. … … ………. … ………. … … Xi Xi1 Xi2 ………. Xij ………. Xim Xi. … … … ………. … ………. … … Xk Xk1 Xk2 ………. Xkj ………. Xkm Xk. total x.1 x.2 ………. x.j ………. x.m x.. x1 x2 . . . xk = les modalités de x 1 y2 . . . yk = les modalités de y y x1 .effectifs pour la 1ére modalités de x et pour toutes les modalités de y La distribution marginale de X : X(xi) Xi. X1 X1. X2 X2. . . . . Xi Xi. Xk Xk. Total X.. - 60 -
  • 61. GROUPE MIAGE Pr Hammoucha Yassine La distribution marginale de y : Distribution conditionnelle relatif à X et à Y Dist. Conditionnelle relative à X Dist. Conditionnelle relative à Y X Xij X1 X1j X2 X2j . . . . Xi Xij Xk Xkj Total X.j 3- La régression linéaire A. Présentation du problème : Soit le tableau suivant : Ce tableau est un tableau de contingence ou les observations sont connues individuellement, On peut présenter plus simplement ce tableau de la manière suivante : y Xij y1 Xi1 y2 Xi2 . . . . yi Xij ym Xim Total Xi. - 61 -
  • 62. GROUPE MIAGE Pr Hammoucha Yassine Nous avons un ensemble de points « un nuage statistique »qui nous indique que les prix estles quantités évoluent selon la même tendance. i sont inconnus et qu’il de régression ssion c’est le fait de relier y à x par une fonction Calcule des paramètres de la droite de régression : B. la méthode des moindres carrés Il est possible de schématiser ce nuage : -Par une fonction simple : la fonction linéaire (Droite) qu faudra trouver. a=pente de droite b=ordonnée à l’origine Une telle droite est appelée droite de régression D(x) fficient A=coe a régre L Notion de moindres carrés : Partons d’un nuage statistique théorique : - 62 -
  • 63. GROUPE MIAGE Pr Hammoucha Yassine C. Calcul des paramètres de la droite de régression. - 63 -
  • 64. GROUPE MIAGE Pr Hammoucha Yassine - 64 -
  • 65. GROUPE MIAGE Pr Hammoucha Yassine ans le paragraphe précédent, nous avions estimé y en fonction de x, et nous avions btenu la droite de régression Dy(x) atistique estimer x en fonction de y, et trouver la droite de régression Dx(y) lui aura pour équation. 4- la corrélation linéaire : D o On peut pour le même nuage st Pour toute yi, nous avons une valeur observée xi. Pour toute yi, nous avons une valeur estimée sur la droite x’i Pour toute yi, nous avons une erreur d’estimation égale à | xi – x’i | ve Dx(y) idéale est tel que : ∑ | xi – x’i | minimum ou encore ∑ (xi – x’i) 2 minimum En procédant de la même manière que dans le paragraphe précédent, on trou l’équation de Dx(y). - 65 -
  • 66. GROUPE MIAGE Pr Hammoucha Yassine - 66 -
  • 67. GROUPE MIAGE Pr Hammoucha Yassine Si on appelle coéff de corrélation la Quantité r tel que : r2 = a . a’, on peut écrire : • Si r = ±1 on a une corrélation parfaite. • Si r = +1 on a une corrélation parfaite positive. • Si r = -1 on a une corrélation parfaite. d les variables varient dans le même sens. • Si r = 0 = corrélation nulle. Application : calculer le coefficient de corrélation d’une autre façon (existe-t-il un lien entre y et x). Corr. positive : c à • Si r = -1 = corrélation parfaite négative. rient en sens inverse. C à d les deux phénomènes va Par exemple Prix et Quantité , e le est d’a • Si 0 < r < 1 = la corrélation est positive l utant plus forte que l’on se rapproche de 1. • Si -1 < r < 0 = la corrélation est négative, et elle est d’autant plus forte que l’on se rapproche de -1. - 67 -
  • 68. GROUPE MIAGE Pr Hammoucha Yassine On a une très forte corrélation car r = 0.975 tend vers 1 Remarque : lorsqu’on écrit r2 = a. a’ r = racine a .a’, nous avons une expression très positif. Comment trouver alors le signe d’une corrélation ? Réponse : le sens de la corrélation est donnée par le signe de a et a’. • Si a et a’ sont >0 le produit a.a’ >0 : corrélation positive. • Si a et a’ sont <0 le produit a.a’>0 :corrélation négative. On peut dire d’une corrélation qu’elle est très satisfaisante à partir 0.86. On peut dire d’une corrélation qu’elle parfaite à partir de 0.96. Formule développée – Autre formule de r : - 68 -
  • 69. GROUPE MIAGE Pr Hammoucha Yassine Si on appelle : covariance de x et de y l’expression : IX- Analyse Des Séries Chronologiques. A. Définition : B. les différentes composantes d’une série chronologique. 1 – Généralités : Une série chronologique est une série où les observations de la variable sont faites à des intervalles réguliers de temps. Soit la série chronologique suivante : Evolution trimestrielle du chiffre d’affaire d’une entreprise trimètres 1 2 3 4 1998 120 148 155 120 1999 130 162 169 132 2000 144 178 186 145 2001 157 196 210 160 Représentation graphique de la série : - 69 -
  • 70. GROUPE MIAGE Pr Hammoucha Yassine L’examen d’une série chronologique révèle l’existence de différences composantes : Un mouvement de tendance longue (à long terme), appelée « trend ». Un mouvement saisonnier qui est les variations saisonnières. : s variations ge » de la série est appelée Ajustement. Les 2 stement les plus utilisés sont : A. la méthode des moyennes mobiles : 1 Des variations accidentelles : ce sont des variations imprévisibles dues à des circonstances exceptionnelles. C. intérêt d’une analyse d’une série chronologique L’analyse des séries chronologiques permet de séparer le mouvement de long terme du mouvement saisonnier, ce qui nous permettra de faire des calculs de prévision. 2 – l’analyse de la tendance longue : « trend » Déterminer le trend, cela revient à « saisonnières, cette technique de « lissa lisser » la série pour éliminer le méthodes d’aju La méthode des moyennes mobiles. L’ajustement analytique. Elle consiste à diviser un nuage statistique en « sous – nuages » comprenant chacune (n–1) données du sous nuages précédent, et à remplacer chaque sous nuage par un point tel que : x’i = médiane des xi – yi = moyenne des valeurs yi B. Opérations sur les matrices : – matrices transposées : 2 – L’addition : - 70 -
  • 71. GROUPE MIAGE Pr Hammoucha Yassine 3- Multiplication par un réel : X- Les Probabilités et l’analyse combinatoire 1- Le modèle probabiliste Voici les premières phrases d'un manuel : "La théorie des probabilités est une science mathématique étudiant les lois régissant les phénomènes aléatoires. Un phénomène est aléatoire si, reproduit maintes fois, il se déroule chaque fois un peu différemment, de sorte que le résultat de l'expérience change d'une fois à l'autre d'une manière aléatoire, imprévisible." L'usage même du mot expérience sous-entend que le phénomène aléatoire est observé t être hacun des résultats possibles est observé avec une certaine fréquence dont la valeur se aléatoire, on note W l'ensemble de tous les résultats s A, on dit que A est réalisé. par le biais d'un critère bien défini, et que le résultat de cette observation peu décrit sans ambiguïté. L'expérience peut aussi être répétée, et on suppose que c stabilise si on répète l'expérience maintes et "maintes fois". C'est cette "loi" que présuppose l'existence d'un modèle probabiliste. Ce premier chapitre est une rapide présentation du cadre formel des modèles Probabilistes. A- Evènements Etant donnée une expérience possibles de cette expérience. Un singleton de Ω est appelé évènement élémentaire. Un sous-ensemble A de Ω est appelé un évènement. Un évènement A est donc un Ensemble constitué de résultats possibles de l'expérience. Si le résultat d'une expérience est dan - 71 -
  • 72. GROUPE MIAGE Pr Hammoucha Yassine On tire une boule dans une urne contenant 2 boules blanches, 1 noire, 4 vertes, 5 rouges, et on regarde sa couleur. Si on répète cette expérience, la fréquence avec B- Loi de probabilité, espace de probabilité - 72 -
  • 73. GROUPE MIAGE Pr Hammoucha Yassine laquelle on obtient une boule rouge se stabilise peu à peu sur une valeur, égale ici à 5/12. On dit couramment qu'on a 5 chances sur 12 de tirer une boule rouge. Dans le cadre d'un modèle mathématique de cette expérience aléatoire, on dira que t L'additivité 'on a 5 chances sur 12 de tirer une boule rouge et 2 ule soit t seulement que si on tire une boule, on a 100% de l'évènement "tirer une boule rouge" a la probabilité 5/12. Plus généralement, dans un modèle probabiliste, chaque évènement est pondéré par un nombre compris entre 0 e 1, sa probabilité. Ces probabilités doivent respecter certaines règles de compatibilité, naturelles si on les interprète en termes de "nombre de chances sur 100". est la principale de ces règles. Appliquée à un cas particulier dans notre exemple, elle exprime simplement que, puisqu chances sur 12 de tirer une blanche, on a 5+2 chances sur 12 de tirer une bo rouge soit blanche. L'autre règle di chances de …tirer une boule… Définition 1 Soit Ω un ensemble. Une loi de probabilité P sur Ω est une fonction qui à tout évènement A associe un nombre réel P(A), et qui a les trois propriétés : Exemple 1 : On lance un dé et on observe la face du dessus. On posera : et on supposera que le dé est parfaitement équilibré, de sorte que la probabilité d chaque face est la même : e Remarquo le en utilisant la propriété des trois ensemble ns qu'alors, la probabilité de tout évènement est calculab c) de la définition. Par exemple, comme {1, 3, 4} est la réunion s 2 à 2 incompatibles {1}, {3} et {4}, on a : Plus généralement, soit Ω un ensemble fini : Définir une loi de probabilité P sur Ω revient à se donner n réels positifs ou nuls p1, p2, ...., pn tels que et à poser, pour tout indice k, P({wk}) = pk. La loi de probabilité sur Ω est alors complètement déterminée car, étant donné un évènement osent A. A, P(A) est calculable en additionnant les probabilités pk de chacun des évènements élémentaires {wk} qui comp - 73 -
  • 74. GROUPE MIAGE Pr Hammoucha Yassine Il en est de même si Ω est un ensemble dénombrable, les sommes finies sont alors remplacées par les sommes de séries. Exercice 2 : Soit (Ω, P) un espace de probabilité. Répondre aux questions en utilisant la définition 1 : a) Si A est un évènement de probabilité P(A) connue, que vaut P(Ac) ? et P(B). Montrer que P(A ou B) £ P(A)+P(B). Généraliser cette inégalité à un nombre fini d'évènements. On pourrait aussi démontrer les propriétés suivantes : b) Si A B, comparer P(A) et P(B). c) Calculer P (A ou B) en fonction de P(A et B), P(A) d) C- Le cas où les évènements élémentaires sont équiprobables Soit (W, P) un espace de probabilité correspondant à une expérience aléatoire dont l'ensemble des résultats possibles est fini : Supposons que chaque résultat "a autant de chances d'être réalisé qu'un autre", soit, en termes probabilistes, que P est telle que : Comme la somme de ces n nombres est 1, leur valeur commune est égale à 1/n . Soit maintenant un évènement A. Sa probabilité est : Cette loi de probabilité est souvent appelée loi uniforme sur Ω. Calculer des ient donc à dénombrer des e sait pas lire prend les 6 jetons d'un jeu de osaient le mot "CARTON". Il réaligne ces jetons au hasard. Avec ecompose-t-il ce mot ? Même question s'il a pris les 8 jetons qui ot "INSTITUT". p e robabilités par une méthode directe dans ce cas rev nsembles. Exercice 3 : Un jeune enfant qui n Scrabble qui comp quelle probabilité r composaient le m - 74 -
  • 75. GROUPE MIAGE Pr Hammoucha Yassine Exercice 4 : 20 sujets sont au programme d'un oral d'examen. Le candidat tire au sort 3 de ces sujets et traite l'un de ces trois. Combien doit-il avoir révisé de sujets pour avoir au moins 9 chances sur 10 de pouvoir traiter un sujet qu'il a révisé ? Remarque sur le choix du modèle probabiliste Comme dans tout problème de modélisation, il n'y a pas d'automatisme qui permette reprenons l'exemple de l'urne introduisant le paragraphe 2. Deux modèles peuvent être considérés comme naturels : - On peut distinguer les 12 boules contenues dans l'urne en posant : d'associer un espace de probabilité à une expérience aléatoire "concrète". Même dans des cas d'école, il n'y a jamais un seul "bon" choix : D- Exercices Exercice 5 : Soit (Ω, P) un espace de probabilité, et soient A et B deux évènements. Montrer que si P(A) = P(B) = 0,9 , alors, P(A B) ≥ 0,8 . groupe de n personnes, auxquelles on a b) Avec quelle probabilité sont-ils distants de r places, c'est-à-dire séparés par r-1 personnes. Représenter ces probabilités par un diagramme en bâtons. Dans le cas général, montrer que P(A B) ≥ P(A)+ P(B) - 1 . Exercice 6 Deux personnes sont tirées au sort dans un groupe de 30 composés de 10 femmes et 20 hommes. Avec quelle probabilité ces deux personnes sont-elles des hommes ? Avec quelle probabilité sont-elles des femmes ? font partie d'un Exercice 7 Deux amis distribué au hasard des numéros d'ordre pour constituer une file d'attente. a) Avec quelle probabilité sont-ils les deux premiers ? - 75 -
  • 76. GROUPE MIAGE Pr Hammoucha Yassine Exercice 8 Un tiroir contient en vrac les 20 chaussettes de 10 paires différentes. On en sort au hasard 4 chaussettes. Avec quelle probabilité obtient-on : a) 2 paires b) au moins une paire 2- Probabilités conditionnelles A- Définition Lançons un dé parfaitement équilibré. Un bon modèle probabiliste en est donné par : muni de la loi de probabilité P uniforme. cette nouvelle expérience, l'évènement A est réalisé quand on obtient un 5, et c'est Notons A l'évènement "le dé donne au moins 4 points" et B l'évènement "le résultat est impair". Supposons qu'on ne retienne le résultat du lancer que s'il est dans B. Dans avec la probabilité relative Plus généralement la probabilité relative de A sous la condition que B est réalisé est . On l'appelle aussi probabilité de A sachant que B, ou probabilité conditionnelle de A relative à B, etc… Définition : Soit (Ω, P) un espace de probabilité, et soit B un évènement tel que P(B) ≠ 0. La probabilité de A sachant que B est notée P(A | B), et est définie par : Exercice 9 : a) Soit B un évènement tel que P(B) ≠ 0. Montrer que l'application qui à A associe P( A | B ) est une loi de probabilité sur Ω. 0, b) Donner une propriété de A qui implique P(A | B) = 1, qui implique P(A | B) = qui implique Exercice 10 : Un couple a deux enfants. Sous l'une des conditions suivantes : ants est un garçon, avec quelle probabilité le couple a-t-il un fils et une fille ? B- Deux résultats de décomposition Les deux résultats de ce paragraphe utilisent "à l'envers" la définition 2-1, c'est-à-dire donnent un moyen de calcul de probabilités connaissant des probabilités conditionnelles. Ils sont très utiles dans la pratique. a) l'aîné est un garçon, b) l'un des enf Exemple: Une urne contient deux boules blanches et une boule noire. Une personne tire une boule et la garde, une deuxième personne tire une boule. Avec quelle probabilité les deux boules tirées sont-elles blanches ? On peut répondre à cette question en utilisant la définition. - 76 -
  • 77. GROUPE MIAGE Pr Hammoucha Yassine En effet, notons A l'évènement "la première personne a tiré une boule blanche" et B l'évènement "la deuxième personne a tiré une boule blanche". D'après la définition, P (A et B) = P (B | A) P(A). Mais P(A) est connue, c'est 2/3. P(B | A) est aussi connue : c'est ière personne ayant tiré une boule blanche, la deuxième personne tire une oule au hasard dans une urne qui contient une boule blanche et une boule noire. Ainsi, P(A et B) vaut (2/3).(1/2) = 1/3 .· alise ce procédé de calcul : Proposition 1/2 car, la prem b La proposition suivante, parfois appelé "théorème des probabilités composées", génér : Soit (Ω, P) un espace de probabilité, et soient A1, A2,…, An des évènements. On a : Cet énoncé est constamment utilisé dans le contexte des "chaînes de Markov", qui Interviennent naturellement dans les problèmes concrets où A1, A2,…, An représente une succession (temporelle) d'évènements, la probabilité de réalisation du n-ième évènement An étant conditionnée par "le passé" (probabilité sachant que A1 et … et An-1 ont eu lieu). En voici un exemple simple : Exercice 11: On sait que si le flash d'un appareil photo n'a pas eu panne durant les n premiers déclenchements (n entier positif ou nul), la probabilité pour qu'il fonctionne au (n+1)-ième est égale à p (0 < p <1 ). a) Quel est la probabilité pour qu'il n'ait pas de panne au cours des 100 premiers déclenchements ? b) Sachant qu'il a fonctionné n fois, avec quelle probabilité fonctionnera-t-il au moins 100 fois de plus ? ossibles Ω. En termes ensemblistes, {C1, C2, …, Cn} est donc une partition de Ω ; en termes probabilistes, on l'appelle un système complet d’évènements. Soit A un évènement. On a bien sûr : Soient C1, C2, …, Cn n évènements deux à deux disjoints et dont la réunion est l'ensemble de tous les résultats p et en utilisant la définition, on obtient le résultat : Proposition: Soit (Ω, P) un espace de probabilité, et soit {C1, C2, …, Cn} un système complet d'évènements. Soit A un évènement. On a : (Remarquons sans démonstration que ce résultat se généralise à un système complet INSEE 1994), la population active en dénombrable d'évènements.) Exercice 12: En mars 1994 (enquête sur l'emploi - 77 -
  • 78. GROUPE MIAGE Pr Hammoucha Yassine France comprend 44,7% de femmes. Le taux de chômage chez les hommes est 10,8% ; il est chez les femmes 14,3% . On tire au sort une personne parmi les actifs. a) Avec quelle probabilité est-elle au chômage ? b) Sachant qu'elle est au chômage, avec quelle probabilité est-ce une femme ? C- Evènements indépendants Définition : Exercice 13 mpatibles sont-ils indépendants ? c) Par un diagramme donner un exemple d'évènements A, B, C deux à deux indépendants Mais qui ne sont pas indépendants dans leur ensemble. Remarque : a) Montrer que si A et B sont indépendants, A et Bc, Ac et B, Ac et Bc le sont aussi. Généraliser cette remarque au cas d'une famille finie d'évènements indépendants dans leur ensemble. b) Deux évènements A et B inco : Lançons deux dés, chacun parfaitement équilibré. L'ensemble des résultats Possibles est : Notons A l'évènement "le premier dé donne 4". Comme le premier dé est parfaitement équilibré, la probabilité de A est 1/6. Notons B l'évènement "le deuxième dé donne 6". Comme le deuxième dé est parfaitement équilibré, la probabilité de A est 1/6. De plus, nous pouvons sans difficulté supposer D que les évènements A et B sont indépendants. la loi uniforme sur Ω pour représenter l'expérience odèle n fois de façon indépendante, on choisira onc, la probabilité de (A et B), c'est-à-dire de l'évènement élémentaire (4, 6), est égale à (1/6).(1/6) = 1/36, et de même bien sûr pour tout autre couple (i, j). Ce e le choix de raisonnement confirm aléatoire du lancer de deux dés. lle probabilité la somme des points Exercice 14 : On lance deux dés. Avec que obtenus est-elle égale à 11 ? à 10 ? ent, considérons une expérience aléatoire dont (Ω, P) est un m Plus généralem probabiliste. Si cette expérience est répétée - 78 -
  • 79. GROUPE MIAGE Pr Hammoucha Yassine comme ensemble de résultats ~Ω = Ωn , qu'on munira de la probabilité produit ~P, c'est à- dire telle que, quels que soient les sous-ensembles A1, A2,…, An de Ω : D- Exercices Exercice 15 : Avec quelle probabilité une famille de 3 enfants comporte-t-elle au moins un garçon ? Exercice 16 : Dans un groupe de 20 personnes, quelle est la probabilité pour qu'il n'y ait jamais plus d'un anniversaire par jour ? Et dans un groupe de 50 personnes ? (on fera comme si toutes les années avaient 365 jours). Exercice 17 : Une expérience est conduite pour étudier la mémoire des rats. Un rat est mis devant trois couloirs. Au bout de l'un d'eux se trouve de la nourriture qu'il aime, au bout des deux autres, il reçoit une décharge électrique. Cette expérience élémentaire est répétée jusqu'à ce que le rat trouve le bon couloir. Sous chacune des hypothèses s enir des expériences antérieures, abilité la première tentative réussie est-elle la k-ième ? Représenter graphiquement les réponses. Exercice 18 : Pour décider d'un traitement thérapeutique, on utilise un test qui est positif 99 fois sur 100 si une personne est effectivement malade. Mais si une personne n'est pas malade, le test est positif une fois sur 100. On sait par ailleurs que 5 personnes sur 100 ont cette maladie. a) Si le test d'une personne est positif, avec quelle probabilité cette personne est-elle effectivement malade ? b) Si le test d'une personne est négatif, avec quelle probabilité cette personne n'est-elle effectivement pas malade ? Calculer ces probabilités quand on sait que 5 personnes sur 1000 ont cette maladie. Exercice 19 : La probabilité de fermeture du relai i des circuits décrits ci-dessous est pi. B ? uivantes : (H1) le rat n'a aucun souv (H2) le rat se souvient de l'expérience immédiatement précédente, (H3) le rat se souvient des deux expériences précédentes, avec quelle prob Tous les relais est la probabilit fonctionnent indépendamment. Dans chacun des cas suivants, quelle é pour que le courant passe entre A et a) A et B sont séparés par n relais reliés en série. b) A et B sont séparés par n relais reliés en parallèle. c) - 79 -
  • 80. GROUPE MIAGE Pr Hammoucha Yassine d) Exercice 20 : On transmet un message composé de n symboles binaires '0' ou '1'. Lors de la transmission, chaque symbole est perturbé avec la probabilité p et se transforme alors en symbole opposé. Par précaution, le message est transmis deux fois. Si les deux messages transmis coïncident, l'information est considérée comme correcte. a) Avec quelle probabilité le i-ième symbole du premier message transmis est-il identique robabilité les deux messages transmis sont-ils identiques ? c) Trouver la probabilité pour que, malgré la coïncidence des deux messages, l'information s'avère erronée. (Application numérique : n = 100 p = 0,001). Exercice 21 : Un candidat d'un jeu télévisé américain est face à trois portes. Derrière l'une d'elles se trouve le prix, - une voiture -. Le candidat se place devant la porte de son choix. Le présentateur de l'émission, qui lui sait où se trouve la voiture, ouvre alors l'une des deux autres portes et indique au candidat que la voiture ne s'y trouve pas. Le candidat peut à son tour ouvrir une porte. S'il découvre la voiture, il la gagne. Un candidat décide d'adopter l'une des trois stratégies suivantes : a) ouvrir la porte devant laquelle il s'est placé à l'issu de son premier choix, b) ouvrir l'autre porte, c) tirer à pile ou face et, s'il obtient pile, ouvrir la porte devant laquelle il s'est placé à l'issu de son premier choix, ouvrir l'autre porte s'il obtient face. L'une de ces trois stratégies est-elle préférable aux autres ? X A Dans beaucoup de situations, le détail du résultat d'une expérience aléatoire ne nous intéresse pas, mais seulement une valeur numérique fonction de ce résultat. Par exemple, on peut se demander quel est le nombre de pannes d'un ordinateur sur une du lancer des deux dés : au i-ième symbole du deuxième message transmis ? b) Avec quelle p I- Les variables aléatoires 1- Généralités - Définitions durée d'un an, sans être intéressé par les dates auxquelles ont lieu ces pannes. Etudions un exemple plus simple : Exemple: On lance deux dés, et on regarde la somme des points obtenus. On choisit pour modèle probabiliste - 80 -
  • 81. GROUPE MIAGE Pr Hammoucha Yassine muni de la loi de probabilité P uniforme, qui affecte à chaque évènement élémentaire (i, j) la probabilité P{(i, j)} = 1/36. Avec quelle probabilité la somme des points obtenus est elle égale, par exemple, à 5 ? C'est la probabilité de l'ensemble des évènements élémentaires (i, j) qui réalisent cette condition. par : La question posée est le calcul de la probabilité de l'évènement { (i, j)∈Ω / S(i, j) = 5 },c'est-à-dire de l'évènement { (1, 4), (2, 3), (3, 2), (4, 1) }. On notera cet évènement, de façon simplifiée, { S = 5 }. On trouve : Remarquons que S prend ses valeurs dans {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} et que, par conséquent : Abordons maintenant le cas général, dans lequel l'ensemble des valeurs prises par une variable aléatoire n'est pas forcément fini ou dénombrable : Définition: On appelle variable aléatoire une application X définie sur un espace de probabilité (Ω, P) et à valeurs réelles. Exercice 22 : Représenter la fonction de répartition de la variable aléatoire S de l'exemple Exercice 23 : Soit X une variable aléatoire, e soit F sa fonction de répartition. Pour a et b réels (a < b), exprimer en fonction de F : P( X > a ), P( a < X ≤ b ), P(X < a ) (utiliser la proposition 1-1-b), P( X ≥ a), P( X = a ), P( a ≤ X < b ), … t - 81 -
  • 82. GROUPE MIAGE Pr Hammoucha Yassine Exercice 24: Soit X une variable aléatoire. On suppose que sa fonction de répartition F est donnée par : B- Variables aléatoires discrètes, variables aléatoires à densité - 82 -
  • 83. GROUPE MIAGE Pr Hammoucha Yassine Exercice 25: On fait tourner une aiguille autour d'un axe et on repère la position sur laquelle elle s'arrête par un angle Θ de [0, 2π[. a) Quelles valeurs proposer pour P( 0 ≤ Θ < π ), P( π ≤ Θ < 2π ), P( π/2 ≤ Θ < 3π/2 ) ? Et pour P(Θ∈I) lorsque I est un sous-intervalle de [0, 2π[ ? b) Peut-on proposer une fonction f qui soit la densité de la loi de Θ ? Remarquons que si X est une variable aléatoire à densité, la densité f vérifie nécessairement : Exercice 26 : Soit X une variable aléatoire à densité f définie par : Exercice 27 : Reprendre l'exemple de l'exercice 24, et montrer qu'on peut écrire : où f est une fonction à déterminer. C- Couples de variables aléatoires - 83 -
  • 84. GROUPE MIAGE Pr Hammoucha Yassine Exercice 28 : Soient (X, Y) un couple de variables aléatoires dont la loi est telle que, si i et j sont deux entiers tels que D- Variables aléatoires indépendantes Définition: Soient X et Y deux variables aléatoires définies sur un espace de probabilité (Ω, P). On dit qu'elles sont indépendantes si pour tout couple (A, B) de sous Exercice 29 : a) Soient (X, Y) un couple de variables aléatoires de loi donnée par : X et Y sont-elles indépendantes ? b) même question avec les données de l'exercice 28 ercice 30 Ex - 84 -
  • 85. GROUPE MIAGE Pr Hammoucha Yassine Dans le cas général, on montre la proposition : bles aléatoires définies sur un espace de FY. X et Y sont indépendantes si et seulement si, pour tout couple (x, y) de réels : Proposition 1: Soient X et Y deux varia probabilité (Ω, P), de fonctions de répartitions FX et Le résultat suivant est utile : Enonçons enfin une extension de la définition : E- Exercices : On équipe un local souterrain de 5 ampoules électriques. On suppose ue les durées de vie de ces ampoules sont des variables aléatoires indépendantes, et e même densité f donnée par : Exercice 31 q d On contrôle l'état des ampoules après 300 heures d'utilisation. Avec quelle probabilité sont-elles hors d'usage. : Une boîte contient 5 transistors, dont on sait que 3 sont défectueux. On ste l'un après l'autre les transistors et on les met de côté, jusqu'à avoir trouvé les éfectueux. On note N1 le nombre de tests effectués pour trouver le premier deux (exactement) des ampoules Exercice 32 te d - 85 -
  • 86. GROUPE MIAGE Pr Hammoucha Yassine transistor défectueux, et N2 le nombre de tests complémentaires effectués pour ouver le deuxième. écrire la loi conjointe de N1 et N2. : Soient X1,…, Xn des variables aléatoires indépendantes et suivant toutes loi uniforme sur [0, 1]. On pose : = max (X1,…, Xn) ) Quelle est la fonction de répartition de M ? Quelle est la densité de la loi de M ? es questions avec min (X1,…, Xn). - Caractéristiques numériques des variables aléatoires - Espérance tr D Exercice 33 la M a b) Mêm 2 A Exercice 34: Quelle est l'espérance de la variable aléatoire qui représente le nombre de : Quelle est l'espérance de la variable aléatoire de l'exercice 3-4 ? : Dans chacun des deux cas suivants, calculer E(X), décrire la loi de X2 et Calculer E(X2) : points obtenus en lançant un dé ? Exercice 35 Exercice 36 - 86 -
  • 87. GROUPE MIAGE Pr Hammoucha Yassine Exercice 37 : Reprendre les exemples de l'exercice 4-3 et calculer E(X2) en utilisant la L'énoncé suivant ser r la suite : éatoires sur un espace de probabilité proposition 1. a très utilisé pa Proposition 2 : Soient X et Y deux variables al (Ω, P), et soient a et b deux réels. Alors : Exercice 38 : Montrer la deuxième égalité de cette proposition dans le cas où les lois s, et on note S la varia eprésente la somme des points obtenus. Quelle est l'espérance de S ? de X et Y sont discrètes. Exercice 39 : On lance deux dé ble aléatoire qui r B- Variance, covariance Exemple: Considérons les quatre variables aléatoires : X1 = 0, c'est-à-dire la variable "aléatoire" constante et nulle e sur [-1, 1] X3 de loi uniforme sur [-100, +100] (T=2000) = P(T=4000) = ¼ pour espérance 0, mais leurs lois sont clairement différentes. Une tingue est l'étalement, la dispersion, des valeurs qu'elles prennent , X2 de loi uniform X4 telle que P(T=-3000) = 1/2 P Elles ont toutes quatre caractéristique qui les dis autour de leur valeur moyenne E(Xi) = 0. Une façon de mesurer cette dispersion est de regarder la valeur moyenne de la distance entre Xi et E(Xi). Pour des raisons pratiques, on - 87 -
  • 88. GROUPE MIAGE Pr Hammoucha Yassine préfère choisir la valeur moyenn ntre Xi et E(Xi), qu'on appelle la variance. Définition e du carré de la distance e : Soit X une variable aléatoire sur un espace de probabilité (Ω, P). La variance ν(X) de X est : Exercice 40 : Calculer les variances des variables aléatoires Xi de l'exemple Précédent Exercice 41 : On lance un dé, et aléatoire qui représente le nombre de points obtenus. Quelle est la variance de X ? Proposition 3 : Soit X une variable aléatoire. on note X la variable Appelle la variable aléatoire centrée réduite associée à X. Le passage de l'une des variables à l'autre se fait tout simplement par un changement d'origine et d'unité dans l'ensemble rises par X. iance d'une variable aléatoire n'est manifestement pas linéaire. De Exemple 2: Soit par exemp e non nulle, - c'est-à-dire qui n'est pas presque sûrement constante -. On a : des valeurs p L'expression de la var fait, si X et Y sont deux variables aléatoires sur (Ω, P), en général, la variance de la somme X+Y n'est pas égale à la somme des variances de X et de Y : le X une variable aléatoire de varianc Calculons dans le cas général ν(X+Y). Comme : - 88 -
  • 89. GROUPE MIAGE Pr Hammoucha Yassine Proposition 4 : Soient X et Y deux variables aléatoires sur (Ω, P). Si X et Y sont indépendantes, alors : Exercice 42: Démontrer la proposition dans le cas où les lois de X et Y sont discrètes. Exercice 43 : On lanc qui représente la somme des points obtenus. Quelle est la variance de S ? Une caractéristique souvent utilisée en statistiques est un coefficient appelé coefficient de corrélation de deux variables aléatoires X et Y. C'est par définition, - et si ni X ni Y n'est presque sûrement constante - : e deux dés, et on note S la variable aléatoire - 89 -
  • 90. GROUPE MIAGE Pr Hammoucha Yassine C- Exercices Exercice 44 : Calculer l'espérance et la variance de la variable aléatoire M de l'exercice 33 Exercice 45 : Les transistors fournis par une usine sont défectueux dans la proportion p. On teste un transistor après l'autre jusqu'à en obtenir un bon. On note N le nombre de tests effectués. Quelle est la loi de N ? Calculer l'espérance de N. és fonctionnent. Le procédé de construction des sous-unités est tel qu'elles sont défect amment les unes des autres. i constituée. Si elle ne marche pas, on la jette, et on recommence jusqu'à obtenir une bonne machine. On note : cu le coût de construction d'une sous-unité, tu le coût du test d'une sous-unité, tm le coût du test d'une machine, t on suppose pour simplifier que le coût d'assemblage des unités est nul. 1) On note C le coût de construction d'une bonne machine. Calculer l'espérance de C dans les deux cas a) et b). Exercice 46 : Une machine est constituée de n sous-unités identiques. Elle fonctionne si toutes ses sous-unit ueuses dans la proportion p, et indépend Pour construire une machine sans défaut, deux procédés sont envisagés : a) On construit une sous-unité, on la teste, si elle est bonne, on la monte, sinon, on la jette, etc… On continue jusqu'à avoir monté les n sous-unités de la machine. On suppose pour simplifier qu'il n'y a pas de problème de montage. La machine ainsi construite est donc bonne. b) On construit et monte sans les tester n sous-unités, et on teste la machine ains e 3-Variables aléatoires usuelles ropriétés d es lois con pourra trouver beaucoup dans la "litté : les loi étriques (exercice 45), ue, multinomiale, gamma, etc…, et nous en in s d'autres dans la partie Voici une liste de définitio classiques ns et p e quelqu nues. On d'autres lois iq rature" s géom hypergéométr "statistiques" troduiron de ce cours. A- - 90 -
  • 91. GROUPE MIAGE Pr Hammoucha Yassine B- Exercice 47 : On lance 4 fois un dé. On note X le nombre de fois où on obtient 6. a) Pour k = 0, 1, 2, 3, 4, calculer P(X = k). b) On note Xi la variable de Bernoulli qui vaut 1 si on tire un 6 au i-ième lancer, 0 si on ne tire pas 6 à ce lancer. Ecrire X en fonction des Xi , et en déduire la valeur de E(X) et de n(X). C- Loi uniforme Exercice 48: Soit X une variable aléatoire de loi uniforme sur [0, 1]. a) Calculer directement E(X) et n(X). b) On pose Y = a + (b-a) X . Que valent E(Y) et n(Y) ? Quelle est la loi de Y ? Qu'en conclut-on ? D- Loi exponentielle Si X suit cette loi : - 91 -
  • 92. GROUPE MIAGE Pr Hammoucha Yassine On peut remarquer aussi que pour tout t positif ou nul : E- F- - 92 -
  • 93. GROUPE MIAGE Pr Hammoucha Yassine G-Exercices - 93 -
  • 94. GROUPE MIAGE Pr Hammoucha Yassine 4-Caractéristiques des lois usuelles A-Variables aléatoires réelles discrètes A-Variables aléatoires réelles continues - 94 -
  • 95. GROUPE MIAGE Pr Hammoucha Yassine - 95 -
  • 96. GROUPE MIAGE Pr Hammoucha Yassine - 96 -