COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
Modelos Lineares Mistos em Atuária
1. Modelos Lineares Mistos Aplicados em Ciˆencias Atuariais
Luis Gustavo Bastos Pinho e Juvˆencio Santos Nobre
Departamento de Estat´ıstica e Matem´atica Aplicada - UFC
RESUMO: Muitos modelos utilizados em Estat´ıstica s˜ao formulados com
base na indepˆendencia entre as observa¸c˜oes. Por´em nem sempre essa su-
posi¸c˜ao ´e razo´avel, especialmente em estudos com medidas repetidas. Mo-
delos mistos apresentam uma maneira de modelar a dependˆencia entre ob-
serva¸c˜oes atrav´es da inclus˜ao de efeitos aleat´orios. S˜ao denominados mode-
los mistos aqueles que cont´em um ou mais efeitos aleat´orios. Em Atu´aria
esses modelos vˆem sendo utilizados com crescente sucesso. Nesse trabalho
ser˜ao apresentadas algumas defini¸c˜oes, exemplos, resultados e analisado um
exemplo de aplica¸c˜ao em Ciˆencias Atuariais.
Palavras-chave: Modelos lineares mistos, medidas repetidas, estudos lon-
gitudinais, Atu´aria.
1 Introdu¸c˜ao
Estudos com medidas repetidas s˜ao aqueles nos quais uma ou mais va-
riav´eis resposta s˜ao observadas por v´arias vezes para cada unidade amostral.
Por unidade amostral entende-se cada elemento que comp˜oe o conjunto ob-
servado e sob o qual se deseja investigar algo. As medidas repetidas podem
ser obtidas em condi¸c˜oes diversas ou sob as mesmas condi¸c˜oes. Quando as
medidas s˜ao obtidas ao longo de uma escala ordenada (tempo, dosagem,
velocidade, etc) ´e dado ao estudo o nome de estudo de dados longitudinais.
A utiliza¸c˜ao de poucas unidades amostrais e a possibilidade de modelar
o comportamento individual de cada unidade amostral s˜ao, entre outras,
vantagens dos estudos com medidas repetidas. Por outro lado, a utiliza¸c˜ao
de medidas repetidas insere novas dificuldades aos processos de modelagem
e estima¸c˜ao. Uma delas ´e a poss´ıvel correla¸c˜ao existente entre medidas
obtidas de uma mesma unidade amostral. Essa correla¸c˜ao, em geral, torna o
processo de estima¸c˜ao mais complicado, pois ´e necess´ario estimar a estrutura
de covariˆancia do modelo.
1
2. 2 Metodologia
Para estimar os parˆametros dos poss´ıveis modelos a serem utilizados,
geralmente s˜ao utilizados m´etodos de m´axima verossimilhan¸ca, e m´etodos
iterativos s˜ao usados para maximizar a fun¸c˜ao de verossimilhan¸ca. Entre
esses m´etodos iterativos podemos citar os de Newton-Raphson, algoritmo
EM, e Escores de Fisher. No caso de modelos lineares mistos mais simples, ´e
poss´ıvel obter estimadores para os parˆametros de maneira descomplicada. `A
medida que o modelo se torna mais geral o aux´ılio de pacotes computacionais
´e mais necess´ario.
O modelo usado para a matriz de covariˆancia do modelo deve depender
da natureza dos dados e permitir como fonte de varia¸c˜ao os erros aleat´orios
e os efeitos aleat´orios, pelo menos. Outra poss´ıvel fonte de varia¸c˜ao ´e a cor-
rela¸c˜ao serial. O crit´erio de informa¸c˜ao de Akaike (AIC) pode ser utilizado
para escolher a estrutura da matriz de covariˆancia mais adequada quando
houver mais de uma op¸c˜ao plaus´ıvel.
Ap´os obter estimativas para os parˆametros dos modelos ´e necess´ario va-
lidar as suposi¸c˜oes feitas. Isso, em geral, ´e conseguido atrav´es da an´alise de
res´ıduos. Para os modelos lineares mistos os res´ıduos s˜ao observados para
verificar lineariedade, observa¸c˜oes discrepantes, observa¸c˜oes com alavanca-
gem alta, al´em de outros eventos, como por exemplo a homocedasticidade
dos erros aleat´orios e a independˆencia condicional das observa¸c˜oes, caso seja
especificado no modelo utilizado tais caracter´ısticas.
3 Modelos Lineares Mistos
A forma funcional do modelo ´e a seguinte:
Yi = Xiβ + Zibi + i i = 1, 2, 3 . . . , k
em que Yi ´e um vetor (ni ×1) com as observa¸c˜oes da i-´esima unidade amos-
tral. Xi ´e uma matriz (ni ×m), em que m ´e o total de vari´aveis explicativas
(regressores). β ´e um vetor m × 1 com os coeficientes de regress˜ao, tamb´em
chamados de efeitos fixos. Zi ´e uma matriz de planejamento, tem dimens˜ao
ni × p e posto completo e ´e conhecida. bi tem dimens˜ao p × 1 e ´e chamado
vetor de efeitos aleat´orios, que ser˜ao usados para modelar a covariˆancia entre
medidas obtidas a partir de uma mesma unidade amostral. E finalmente i
´e o vetor ni × 1 de erros aleat´orios. ´E assumido ainda que:
2
3. • i ∼ N(0, σ2Ini ) para todo i;
• bi ∼ N(0, Ψ∗
) para todo i;
• i e bj s˜ao independentes para todo i e j;
Existe uma maneira ainda mais concisa de representar modelos lineares
mistos:
Y = Xβ + Zb +
em que Y = (Y1, Y2, . . . , Yk) , X = (X1, X2, . . . , Xk) , Z = k
i=1 Zi,
b = (b1, b2, . . . , bk) e = ( 1, 2, . . . k) . ´E assumido que b e possuˆem
estruturas de covariˆancia respectivamente iguais a Ψ = Ik Ψ∗
e R =
k
i=1 Ri, com Ri = σ2Ini . Ent˜ao:
Y ∼ N(Xβ, ZΨZ + R)
Y|b ∼ N(Xβ + Zb, R)
Conhecidas as matrizes de covariˆancia, β e b s˜ao estimados por:
ˆβ = (X V−1
X)−1
X V−1
Y
ˆb = ΨZ V−1
(Y − Xˆβ)
Em que V = ZΨZ +R. As matrizes V,R e Ψ podem ser estimadas atrav´es
de m´etodos de m´axima verssimilhan¸ca e m´axima verossimilhan¸ca restrita.
Esse processo ir´a envolver m´etodos iterativos e pode ser conferido em mais
detalhes em Searle(2001) e Demidenko(2004).
4 Discuss˜ao e Exemplos de Aplica¸c˜ao
Foram apresentados na primeira parte do trabalho trˆes exemplos de da-
dos com medidas repetidas e trˆes modelos foram ajustados aos dois primeiros
exemplos. Um exemplo traz dados sobre a taxa de juros para vendas de car-
ros novos retirado de Tukey(1991). Para esses dados foi ajustado o modelo
yij = µi + ij, em que yij corresponde a j-´esima observa¸c˜ao na i-´esima cidade,
e em seguida foi ajustado o modelo de interceptos aleat´orios yij = αi+jβ+ ij
para o mesmo conjunto de dados. Para esses dois modelos foram calcula-
dos os estimadores dos parˆametros sem aux´ılio de m´etodos iterativos para
demonstrar os processos de m´axima verossimilhan¸ca e m´axima verossimi-
lhan¸ca restrita. O segundo exemplo traz dados simulados para quantidade
3
4. de vendas (Y) em fun¸c˜ao do pre¸co (X) e para ele foi ajustado o modelo
linear de coeficientes aleat´orios, yij = αi + xijβi + ij, j´a com aux´ılios com-
putacionais para demonstrar a utiliza¸c˜ao dos m´etodos de estima¸c˜ao no caso
mais geral. Em seguida foi feita a an´alise de res´ıduos dos modelos ajustados
e mais um conjunto de dados atuariais foi examinado.
5 Considera¸c˜oes
Modelos lineares mistos s˜ao uma ´otima alternativa para modelar a de-
pendˆencia entre observa¸c˜oes e o comportamento individual das unidades
amostrais. Em Atu´aria a aplica¸c˜ao torna-se evidente devido a grande quan-
tidade de problemas pr´aticos envolvendo dados agrupados ou com medidas
repetidas. ´E necess´ario registrar que dentre os problemas em Atu´aria a
suposi¸c˜ao de distribui¸c˜ao normal dos erros nem sempre ´e atendida. Al-
guns trabalhos mostram aplica¸c˜oes de modelos lineares mistos e modelos
lineares mistos generalizados em Atu´aria, como exemplo podemos citar An-
tonio(2007) e Jong e Heller(2008).
REFERˆENCIAS BIBLIOGR´AFICAS
Antonio, K. and Beirlant, J. (2007). Actuarial statistics with generalized
linear mixed models. Insurance: Mathematics and Economics 40(1),
58-76.
De Jong, P. and Gillian, G.Z. (2008). Generalized Linear Models for Insure
Data. Cambridge University Press.
Demidenko, E. (2004). Mixed models: theory and applications. John Wiley
& Sons, New York.
Hoaglin, D., Mosteller, F. and Tukey, J. (1991). Fundamentals of Expla-
natory Analysis of Variance. John Wiley & Sons, New York.
McCulloch, C.E. and Searle S.R. (2001). Generalized, Linear and Mixed
Models. John Wiley & Sons, New York.
4