1. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Statistique de l’assurance, STT 6705
Statistique de l’assurance II
Arthur Charpentier
Universit´e Rennes 1 & Universit´e de Montr´eal
arthur.charpentier@univ-rennes1.fr ou ou charpentier@DMS.UMontreal.ca
http ://freakonometrics.blog.free.fr/
1er septembre 2010
1
2. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
R´ef´erences
Denuit, M. & Charpentier, A. (2005). Math´ematiques de l’assurance non-vie, tome
II. ´Economica.
Charpentier, A., Goulet, V. & Planchet, F. (2010). Actuariat avec R. Springer
Verlag (`a paraˆıtre)
Denuit, M. Mar´echal, X., Pitrebois, S. & Wahlin, J.F. (2009). Actuarial
Modelling of Claim Counts : Risk Classification, Credibility and Bonus-Malus Systems.
Wiley.
Frees, E. (2009). Regression Modeling with Actuarial and Financial Applications.
Cambridge University Press.
de Jong, P. & Helle, G. (2008). Generalized Linear Models for Insurance Data.
Cambridge University Press.
Kaas, R., Goovaerts, M., Dhaene, J. & Denuit, M. (2006). Modern Actuarial Risk
Theory. Springer Verlag.
2
3. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Barˆeme du cours
Le barˆeme pour l’´evaluation du cours consistera en
– un projet (50) de tarification
– un projet (25) de provisionnement
– un projet (25) de mortalit´e prospective
3
4. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Programmation et langage
Les graphiques pr´esent´es en cours, et les applications sont programm´es en R.
Les codes seront mis en ligne sur le blog, ainsi que les bases de donn´ees.
4
5. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Plan du cours
• Introduction g´en´erale
• La tarification a priori
• Les provisions pour sinistres `a payer (IBNR)
• Les tables de mortalit´e prospectives
5
6. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
• Plan du cours
• Introduction g´en´erale
◦ Le mod`ele collectif en tarification, E
N
i=1 Yi = E(N) · E(Yi)
◦ Les mod`eles lin´eaires g´en´eralis´es, E(Yi|Xi) = g−1
(Xi)
◦ Les mod`eles dynamiques Yi,t
• La tarification a priori
• Les provisions pour sinistres `a payer (IBNR)
• Les tables de mortalit´e prospectives
6
7. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Le mod`ele collectif
En tarification, on cherche `a pr´edire la charge totale de sinistre sur une ann´ee de
couverture. Soit N le nombre (al´eatoire) de sinistres survenu sur un an, et
Y1, · · · , YN les coˆuts des sinistres (si N > 0). La charge totale annuelle est
S = Y1 + · · · + YN . Sous des hypoth`eses d’ind´ependance,
E(S) = E(N) · E(Yi)
La probabilit´e P peut ˆetre remplac´ee par n’importe quelle mesure garantissant
l’ind´ependance, et l’identique distribution des nombres et des coˆuts,
E(S|X) = E(N|X) · E(Yi|X)
o`u X d´esigne le facteur d’h´et´erog´en´eit´e (i.e. la classe tarifaire). Un proxy sera
obtenu `a l’aide de variables de tarificaiton {X1, · · · , Xk}
E(S|X1, · · · , Xk) = E(N|X1, · · · , Xk) · E(Yi|X1, · · · , Xk)
◦
7
8. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Le mod`ele lin´eaire g´en´eralis´e
En ´econom´etrie lin´eaire (classique), on cherche `a approcher E(Y |X1, · · · , Xk) par
une forme lin´eaire
Y = β0 + β1X1 + · · · + βkXk + ε = Xβ + ε
o`u g´en´erallement ε est suppos´e N(0, σ2
), i.e.
(Y |X) ∼ N(Xβ, σ2
)
Or les mod`eles gaussiens ne sont pas appropri´es en assurance. On peut consid´erer
un mod`ele Poisson,
(N|X) ∼ P(exp(Xβ))
i.e. on change la loi et le lien entre E(Y ) et le score Xβ
◦
8
9. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les approches dynamiques
En provisionnement, on s’int´eressera aux cadences de paiements, i.e. combien `a
´et´e pay´e l’ann´ee t pour les sinistres survenus l’ann´ee i, Yi,t.
En assurance-vie, on s’int´eressera aux nombres de d´ec`es l’anne t d’individus d’ˆage
i.
Le vieillissement des sinistres et des assur´es se visualise classiquement via un
diagramme de Lexis.
9
10. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lexis diagram in insurance
Lexis diagrams have been designed to visualize dynamics of life among several
individuals, but can be used also to follow claims’life dynamics, from the
occurrence until closure,
in life insurance in nonlife insurance
10
11. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lexis diagram in insurance
but usually we do not work on continuous time individual observations
(individuals or claims) : we summarized information per year occurrence until
closure,
in life insurance in nonlife insurance
11
12. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lexis diagram in insurance
individual lives or claims can also be followed looking at diagonals, occurrence
until closure,occurrence until closure,occurrence until closure,occurrence until
closure,
in life insurance in nonlife insurance
12
13. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lexis diagram in insurance
and usually, in nonlife insurance, instead of looking at (calendar) time, we follow
observations per year of birth, or year of occurrence occurrence until
closure,occurrence until closure,occurrence until closure,occurrence until closure,
in life insurance in nonlife insurance
13
14. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lexis diagram in insurance
and finally, recall that in standard models in nonlife insurance, we look at the
transposed triangle occurrence until closure,occurrence until closure,occurrence
until closure,occurrence until closure,
in life insurance in nonlife insurance
14
15. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lexis diagram in insurance
note that whatever the way we look at triangles, there are still three dimensions,
year of occurrence or birth, age or development and calendar time,calendar time
calendar time
in life insurance in nonlife insurance
15
16. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lexis diagram in insurance
and in both cases, we want to answer a prediction question...calendar time
calendar time calendar time calendar time calendar time calendar time calendar
time calendar timer time calendar time
in life insurance in nonlife insurance
16
17. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
What can be modeled in those triangles ?
In life insurance,
• Li,j, number of survivors born year i, still alive at age j
• Di,j, number of deaths of individuals born year i, at age j, Di,j = Li,j − Li,j−1,
• Ei,j, exposure, i.e. i, still alive at age j
(if we cannot work on cohorts, exposure is needed).
In nonlife insurance,
• Ci,j, total claims payments for claims occurred year i, seen after j years,
• Yi,j, incremental payments for claims occurred year i, Yi,j = Ci,j − Ci,j−1,
• Ni,j, total number of claims occurred year i, seen after j years,
◦
17
18. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
• Plan du cours
• Introduction g´en´erale
• La tarification a priori
◦ Tarification a priori vs. a posteriori
◦ Les variables explicatives : par classes vs. continues
◦ Mod´eliser la fr´equence de sinistres : r´egression de Poisson
◦ La non d´eclaration de sinistres et les mod`eles `a inflation de z´eros
◦ Mod´eliser les coˆuts de sinistres : r´egression Gamma vs. lognormale
◦ ´Ecrˆeter les gros sinistres
• Les provisions pour sinistres `a payer (IBNR)
• Les tables de mortalit´e prospectives
18
19. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Tarification a priori vs. a posteriori
A la fin de l’ann´ee t, on souhaite estimer la prime `a demander `a l’assur´e,
πt = E(St+1|X)
En assurance a priori, on recherche un proxi de X, i.e. la classe de risque, `a l’aide
de variables exog`enes, X1, · · · , Xk, alors qu’en assurance a posteriori, un proxi de
X est obtenu `a l’aide de l’historique de l’assur´e, Yt−h, · · · , Yt−1, Yt.
◦
19
20. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les variables explicatives
Les variables explicatives peuvent ˆetre discr`etes (classes ou facteurs)....
5%
6%
7%
8%
9%
10%
20
22. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les variables explicatives
... que l’on pourra chercher `a lisser
20 40 60 80 100
0.020.040.060.080.100.12
Age du conducteur principal
Fréquenceannuelledesinistres
3 degrés de liberté
5 degrés de liberté
10 degrés de liberté
22
23. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les variables explicatives
On parlera aussi des arbres de r´egression afin de constituer des classes (e.g.
d’ˆage)◦
|
zone:bcdef
puissance < 5.5
zone:bdf zone:bce
agevehicule < 10.5
puissance < 7.5
agevehicule < 2.5
0.001162 0.003053
0.004648 0.002260
0.001323
0.004592
0.004274
0.005648
23
24. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les nombres de sinistres N
La loi la plus classique pour mod´eliser les nombres de sinistres est la loi de
Poisson,
P(N = n) =
e−λ
λk
k!
qui v´erifie E(N) = Var(N) (´equidispersion). Cette loi est de la famille
exponentielle,
P(N = n) = exp
n log λ − λ
1
− log(n!)
avec comme param`etre naturel, θ = log λ = log E(Y ).
◦
24
25. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
La surdispersion et la non-d´eclaration
Si N ∼ P(λ), alors E(N) = Var(N).
Si N suit une loi Poisson m´elange, de facteur d’h´et´erog´en´eit´e (inobservable) Θ,
i.e. (N|Θ) ∼ P(λΘ), alors E(N) < Var(N) En pratique, si la variance est plus
grande que l’esprance, c’est qu’il reste de l’h´et´erog´en´eit´e au sein des classes.
Il est possible d’utiliser une loi binomiale n´egative, ou quasi-Poisson
P(N = n) = exp
n log λ − λ
ϕ
− log(n!)
avec ϕ ∈ R+
le param`etre de surdispersion.
25
26. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
La surdispersion et la non-d´eclaration
Il est aussi possible de consid´erer un mod`ele `a inflation de z´eros,
P(Ni = k) =
πi + [1 − πi] · pi(0) si k = 0,
[1 − πi] · pi(k) si k = 1, 2, · · ·
Si pi correspond un mod`ele Poissonnien, on peut alors montrer facilement que
Var(Ni) = πiµi + πiµ2
i [1 − πi] > E(Ni) = [1 − πi]µi
26
27. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
La surdispersion et la non-d´eclaration
si
P(Ni = k|Xi) =
πi(Xi) + [1 − πi(Xi)] · pi(0|Xi) si k = 0,
[1 − πi(Xi)] · pi(k|Xi) si k = 1, 2, · · ·
la forme de πi(Xi) est ici ◦
20 30 40 50 60 70 80
0.50.60.70.80.9
Age du conducteur princpal
Probabilitédenepasdéclarerunsinistre
27
28. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les coˆuts de sinistres
La loi Gamma est une loi de la famille exponentielle mais pas la loi lognormale.
Mais si log Y = Xβ+ (mod`ele lognormale), alors
E(Y ) = exp Xβ +
1
2
σ2
= exp (Xβ)
◦
28
29. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les gros sinistres
Il est possible de mutualiser les gros sinistres parmi tous les assur´es, pas
seulement ceux de la classe tarifaire, ◦
29
30. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
20 30 40 50 60 70 80 90
0.20.81.4
Age du conducteur principal
Impactrelatif
20 30 40 50 60 70 80 90
0.20.81.4
Age du conducteur principal
Impactrelatif
30
31. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
• Plan du cours
• Introduction g´en´erale
• La tarification a priori
• Les provisions pour sinistres `a payer (IBNR)
◦ La probl´ematique des provisions, et les IBNR
◦ La m´ethode Chain Ladder
◦ Le mod`ele de Mack, E(Ci,t) = λt · Ci,t−1
◦ Les mod`eles factoriels, E(Yi,t) = exp[αi + βt]
◦ Incertitude `a ultime vs. incertitude `a un an
◦ Bornhuter-Ferguson, Cape-Code et les mod`eles bay´esiens
• Les tables de mortalit´e prospectives
31
32. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Introduction au provisionnement
“ Les provisions techniques sont les provisions destin´ees `a permettre le r´eglement
int´egral des engagements pris envers les assur´es et b´en´eficaires de contrats. Elles
sont li´ees `a la technique mˆeme de l’assurance, et impos´ees par la r´eglementation.”
◦
32
34. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Le mod`ele de Mack
H1 E (Ci,j+1|Ci,1, ..., Ci,j) = λj · Cij pour tour i = 0, 1, .., n et j = 0, 1, ..., n − 1
H2 (Ci,j)j=1,...,n et (Ci ,j)j=1,...,n sont ind´ependant pour i = i .
H3 Var (Ci,j+1|Ci,1, ..., Ci,j) = Ci,jσ2
j pour tout i = 0, 1, ..., n et j = 0, 1, ..., n − 1
E [Ri − Ri]2
|Fi = R2
i
n−i−1
k=0
σ2
i+k
λ2
i+k C·,i+k
+
σ2
n−1
[λn−1 − 1]2 C·,i+k
◦
34
35. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les mod`eles factoriels
Assume that
Yi,j ∼ P(µi,j) where µi,j = exp[αi + βj].
the occurrence factor αi the development factor βj
35
36. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
The log-Poisson regression model
Assume that
Yi,j ∼ P(µi,j) where µi,j = exp[αi + βj].
It is then extremely simple to calibrate the model,◦
Yi,j = exp[αi + βj] Yi,j = exp[αi + βj]
on past observations on the future
36
38. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Bootstrap and GLM log-Poisson in triangles
Total amount of reserves ('000 000$)
10 15 20 25 30
(log-Poisson + bootstrap versus lognormal distribution + Mack) ◦
38
40. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
• Plan du cours •
• Introduction g´en´erale
• La tarification a priori
• Les provisions pour sinistres `a payer (IBNR)
• Les tables de mortalit´e prospectives
◦ La mod´elisation de la mortalit´e en actuariat, hpx = P(T > x + h|T > x)
◦ Lecture transversale ou longitudinale du diagramme de Lexis
◦ Le mod`ele de Lee & Carter, E(µi,t) = exp[αi + βiγt]
◦ De la mod´elisation du taux de d´ec`es aux tables prospectives
40
41. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Les notions classiques en assurance vie
Pour calculer la probabilit´e de survie, on note que
hpx = P(T > x + h|T > x) = P(T > x + 1|T > x) · · · P(T > x + h|T > x + h − 1)
i.e.
hpx = 1px · 1px+1 · · · 1px+h−1 =
h−1
i=0
px+i
autrement dit seul le vecteur des px suffit pour calculer toutes les probabilit´es.
Mais ces probabilit´es ne prennent pas en compte le vieilissement, i.e.
hpt
x = Pt(T > x + h|T > x) = Pt(T > x + 1|T > x) · Pt+1(T > x + 2|T > x + 1)
· · · P
◦
41
42. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Lecture transversable vs. lecture longitudinale
Taux de mortalit´e µx,t, ◦
Age
0
20
40
60
80
Année
1900
1920
1940
1960
1980
2000
tauxdemortalité
−8
−6
−4
−2
42
43. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Le mod`ele de Lee & Carter
Assume here that E(D|α, β, γ) = Var(D|α, β, γ), thus a Poisson model can be
considered. Then
Dj,t ∼ P(Ej,t · µj,t) where µj,t = exp[αj + βjγt]
the age factors (αj, βj) the time factor t
43
45. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
A stochastic model for mortality
and one set of parameters depends on the time, γ = (γ1899, γ1900, · · · , γ2005).
qq
qqqqqqq
qq
q
q
qq
q
q
q
q
q
q
qq
qqqqq
qq
q
qqqqqqqqqq
q
qq
q
q
q
q
q
q
q
qq
qq
qqq
q
qqq
q
qq
qq
qqqq
qqqqqqq
qqqqq
qq
qqq
qqqqq
qq
qqq
qqq
qqqq
qq
1900 1920 1940 1960 1980 2000
45
46. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Errors and predictions
exp[αj + βjγt] exp[αj + βj ˜γt]
on past observations on the future
46
47. Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´eciaux, STT 6705V
Forecasting γ
Based on γ = (γ1899, · · · , γ2005), we need to forecast γ = (γ2006, · · · , γ2050).
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
q
qq
qq
qq
q
q
qqqqqqqqqq
qqqqqqqqqq
q
qq
q
q
q
q
q
qq
qq
qqqqqq
qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq
qqq
1900 1950 2000 2050
47