1) O documento discute a teoria de decisão para escolher a melhor ação em situações de incerteza. 2) É apresentado um exemplo de manutenção de relógios para ilustrar como calcular as probabilidades e custos médios de cada ação. 3) Há discussão sobre como informações adicionais sobre os defeitos podem ser usadas para melhorar a regra de decisão.
1. Cap´
ıtulo 10
Introdu¸˜o ` Teoria de
ca a
Decis˜o
a
10.1 Introdu¸˜o
ca
Na situa¸ao geral de decis˜o temos v´rias alternativas bem definidas e procu-
c˜ a a
ramos pela melhor a¸ao dado o problema que temos em m˜os. Al´m disso
c˜ a e
estamos em uma situa¸ao de incerteza e algumas das informa¸oes importantes
c˜ c˜
para a decis˜o s˜o desconhecidas.Dependendo do contexto algumas das decis˜es
a a o
tomadas ter˜o mais m´rito. Este m´rito pode ser medido quantitativamente e
a e e
recebe a denomina¸ao de utilidade. Embora o verdadeiro contexto encontrado
c˜
ap´s decidida a a¸ao seja desconhecido ´ poss´
o c˜ e ıvel coletar informa¸ao que per-
c˜
mita enumerar as possibilidades. A teoria de decis˜o permite combinar esta
a
informa¸ao probabil´
c˜ ıstica e empreg´-la na escolha do melhor curso de a¸ao.
a c˜
No que segue ilustraremos a teoria de decis˜o em a¸ao utilizando um exemplo
a c˜
simples.
10.2 Problema de Decis˜o
a
Suponhamos que n´s sejamos o fabricante de uma linha de rel´gios de pulso
o o
baratos que ´ vendida por uma cadeia de lojas de departamento e supermer-
e
cados. N´s n˜o oferecemos garantias contra defeitos aos clientes. No entanto,
o a
como uma forma alternativa de compensa¸ao efetuamos a manuten¸ao de qual-
c˜ c˜
quer rel´gio apenas uma vez mediante ao pagamento de uma pequena taxa.
o
Ao encontrarem algum defeito os consumidores devem devolver o rel´gio pa-
o
gando uma pequena quantia e fornecendo uma explica¸ao do defeito. N´s ent˜o
c˜ o a
n˜o realizamos nenhum trabalho de manuten¸ao detalhado, apenas ou repo-
a c˜
mos o mecanismo completo, ou executamos a limpeza ou ambos. O servi¸o c
de manuten¸ao ´ oferecido como uma forma de rela¸oes p´blicas n˜o havendo
c˜ e c˜ u a
inten¸oes comerciais. Obviamente, ´ desej´vel manter os custos desse servi¸o
c˜ e a c
87
2. 88 CAP´ ¸˜ ` ˜
ITULO 10. INTRODUCAO A TEORIA DE DECISAO
no patamar mais baixo poss´ ıvel, sujeito a avalia¸ao de quanto desejamos gastar
` c˜
pelas vantagens promocionais proporcionadas pelo esquema.
Para cada rel´gio precisamos tomar a decis˜o de reposi¸ao do mecanismo
o a c˜
ou simples limpeza. Gostar´ ıamos de ser capazes de remediar o problema, se
poss´ıvel, pela alternativa mais barata, a saber, a simples limpeza. Precisamos as-
sim determinar uma estrat´gia de decis˜o entre as duas alternativas manuten¸ao
e a c˜
ou limpeza. Precisamos tamb´m determinar a taxa que cobraremos pelo servi¸o.
e c
Esta situa¸ao pode ser organizada utilizando a teoria de decis˜o. Considere-
c˜ a
mos o que ocorre quando um rel´gio chega para manuten¸ao. Inicialmente s˜o
o c˜ a
poss´ıveis duas a¸oes denotadas a1 e a2 :
c˜
• a1 : limpe o rel´gio primeiro;
o
• a2 : reponha o mecanismo imediatamente.
O conjunto de poss´ ıveis a¸oes ´ denominado o espa¸o de a¸oes e denotado
c˜ e c c˜
A = {a1 , a2 }. Por simplicidade, suponhamos que s´ h´ dois tipos de defeitos:
o a
1. poeira entrou no mecanismo; 2. h´ um problema mecˆnico. Estas s˜o as
a a a
circunstˆncias que s˜o desconehcidas por n´s quando temos que tomar uma
a a o
decis˜o. Estas circunstˆncias podem ser vistas como “estados da natureza”,
a a
atribuindo s´ımbolos:
• θ1 : poeira no mecanismo;
• θ2 : problema mecˆnico.
a
Em analogia ao espa¸o das a¸oes introduzimos tamb´m o espa¸o dos estados
c c˜ e c
{Ω = {θ1 , θ2 }. Equivalentemente, podemos imaginar o espa¸o dos estados como
c
um espa¸o de parˆmetros com o parˆmetro θ apresentando dois valores θ 1 e θ2 .
c a a
Claramente, a¸oes diferentes levar˜o a conseq¨ˆncias distintas, dependendo
c˜ a ue
do estado da natureza. Por exemplo, se o mecanismo estiver quebrado (estado
θ2 ) n˜o adiantar´ apenas efetuar a limpeza (a¸ao a1 ). Suponha que o custo
a a c˜
da limpeza seja 2 (a unidade monet´ria n˜o importa) e que a reposi¸ao custe
a a c˜
5. Podemos ent˜o construir uma tabela que expresse os custos L(ai , θj ) de
a
cada a¸ao ai sob cada uma das circunstˆncias desconhecidas θj . No nosso caso
c˜ a
teremos a tabela abaixo.
L(ai , θj ) θ1 θ2
a1 2 7
a2 5 5
Note que a limpeza (a1 ) no caso de um rel´gio com mecanismo quebrado (θ2 )
o
tem por conseq¨ˆncia os custos da limpeza (2) e da manuten¸ao (5).
ue c˜
Se soubessemos o estado da natureza para qualquer rel´gio que chegasse
o
a f´brica o problema de decis˜o seria trivial: se θ1 (rel´gio sujo) ent˜o a1
` a a o a
(limpeza), se θ2 (mecanismo quebrado) ent˜o a2 (reposi¸ao). No entanto, s´
a c˜ o
saberemos o estado da natureza ap´s tomarmos a decis˜o. O que devemos
o a
fazer ent˜o?
a
3. ˜
10.2. PROBLEMA DE DECISAO 89
Suponha que, embora θ n˜o seja conhecido para um rel´gio particular, a
a o
experiˆncia nos mostra que cerca de 30% deles apresenta problemas mecˆnicos.
e a
Dessa forma, temos uma probabilidade a priori π(θ2 ) = 0, 3 e, portanto, π(θ1 ) =
0, 7. Esta informa¸ao nos ´ muito util, pois com ela podemos determinar o custo
c˜ e ´
m´dio de tomarmos sempre a a¸ao a1 ou sempre a a¸ao a2 :
e c˜ c˜
L(a1 , θ) θ = 2 × 0, 7 + 7 × 0, 3 = 3, 5
L(a2 , θ) θ = 5 × 0, 7 + 5 × 0, 3 = 5, 0
Assim sendo, no longo prazo seria mais barato executar primeiro a limpeza de
todos os rel´gios que chegassem a f´brica.
o ` a
Note que a estrat´gia mudaria se a probabilidade a priori fosse diferente.
e
Por exemplo, se 70% dos rel´gios recebidos tivessem problemas mecˆnicos (θ 2 )
o a
ter´
ıamos: L(a1 , θ) θ = 5, 5 e L(a2 , θ) θ = 5, 0. A estrat´gia mais barata no
e
longo prazo seria ent˜o executar a manuten¸ao em todos os rel´gios que fossem
a c˜ o
devolvidos a f´brica.
a
A informa¸ao que temos sobre os estados da natureza na forma da proba-
c˜
bilidade a priori π(θ) nos permite escolher uma a¸ao com a garantia de que em
c˜
´
m´dia minimizaremos o gasto incorrido. E claro que seria muito azar se, por ex-
e
emplo, escolhecemos a a¸ao a2 e um n´mero enorme de rel´gios com poerira no
c˜ u o
mecanismo aparecesse de uma vez. No entanto, devemos lembrar que a teoria de
decis˜o se aplica em m´dia. Com a tabela de custos acima podemos determinar
a e
uma distribui¸ao a priori neutra, caracterizada por custos iguais seja qual for a
c˜
a¸ao escolhida. Assim ter´
c˜ ıamos:
L(a1 , θ) θ = L(a2 , θ) θ
2π(θ1 ) + 7[1 − π(θ1 )] = 5π(θ1 ) + 5[1 − π(θ1 )]
π(θ1 ) = 0, 4
Se o prior for neutro teremos custos iguais ( L(a1 , θ) θ = L(a2 , θ) θ = 5, 0 )
n˜o importando a a¸ao de nossa escolha.
a c˜
Compliquemos um pouco mais nosso modelo de decis˜o. Al´m da informa¸ao
a e c˜
sobre a probabilidade de cada um dos estados da natureza, h´ tamb´m in-
a e
forma¸ao adicional nas reclama¸oes dos consumidores. Suponha que estes dados
c˜ c˜
possam ser divididos em trˆs categorias: o rel´gio parou de funcionar completa-
e o
mente, o rel´gio apresenta um comportamento err´tico, o rel´gio funciona por
o a o
um per´ıodo depois p´ra. Esta informa¸ao est´ dispon´ para cada rel´gio, as-
a c˜ a ıvel o
sim para cada rel´gio temos uma observa¸ao x apresentando uma das seguintes
o c˜
formas:
• x1 : rel´gio parou completamente;
o
• x2 : rel´gio apresenta comportamento err´tico;
o a
• x3 : rel´gio apenas funciona por um per´
o ıodo limitado.
Esta informa¸ao adicional pode dar alguma indica¸ao sobre o estado da na-
c˜ c˜
tureza. O que temos aqui ´ uma fun¸ao de verossimilhan¸a do tipo que j´ en-
e c˜ c a
contramos quando discutimos a inferˆncia bayesiana, temos uma fun¸ao p(x | θ)
e c˜
4. 90 CAP´ ¸˜ ` ˜
ITULO 10. INTRODUCAO A TEORIA DE DECISAO
que nos dar´ a probabilidade da reclama¸ao x dado o estado do sistema θ. A
a c˜
verossimilhan¸a, em princ´
c ıpio, seria determinada a partir de nossos registros
hist´ricos sobre o processo inteiro, da reclama¸ao a manuten¸ao. Como temos
o c˜ ` c˜
um n´mero discreto de estados e de tipos de reclama¸ao, podemos construir
u c˜
uma tabela contendo os valores assumidos pela fun¸ao de verossimilhan¸a.
c˜ c
p(x | θ) x1 x2 x3
θ1 0, 1 0, 4 0, 5
θ2 0, 7 0, 2 0, 1
Poder´ıamos agora utilizar, ao inv´s da probabilidade a priori, a observa¸ao direta
e c˜
para nossa tomada de decis˜o. Uma regra de decis˜o ´ uma fun¸ao δ(x) que
a a e c˜
determina uma a¸ao a ser tomada caso observemos x. O objetivo principal da
c˜
teoria de decis˜o ´ a obten¸ao de regras de decis˜o. Na tabela abaixo listamos
a e c˜ a
todas as regras de decis˜o (ou estrat´gias) poss´
a e ıveis:
δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8
x1 a1 a1 a1 a1 a2 a2 a2 a2
x2 a1 a1 a2 a2 a1 a1 a2 a2
x3 a1 a2 a1 a2 a1 a2 a1 a2
10.3 Regras de Decis˜o
a
Como poder´ ıamos determinar uma regra de decis˜o δ(x) otima? Note que se
a ´
nos basearmos apenas na verossimilhan¸a teremos que x1 d´ suporte a θ2 , que
c a
x2 d´ suporte a θ1 e que x3 d´ suporte a θ1 .,assim dever´
a a ıamos escolher δ5 =
(a2 , a1 , a1 ). Note que δ4 parece uma p´ssima escolha pois provocar´ custos
e a
m´ximos em todas as alternativas! J´ δ1 e δ8 simplesmente ignoram os dados
a a
e decidem sempre da mesma maneira. Perceba que, embora a verossimilhan¸a c
indique que, observado x1 , θ2 ´ mais prov´vel isto n˜o implica de forma alguma
e a a
que devemos decidir como se θ2 ocorresse o tempo todo. Tudo depender´ do a
custo m´dio considerando cada um dos poss´
e ıveis estados da natureza θ 1 e θ2 .
Para classificarmos as estrat´gias poss´
e ıveis levando em conta este custo m´dio
e
definimos o risco da estrat´gia:e
R(δ, θ) = L[δ(x), θ]p(x | θ). (10.1)
x
O risco expressa o custo m´dio da regra de decis˜o δ(x) dado um particular
e a
estado da natureza θ que ´ apoiado pela evidˆncia fornecida pelo dado x. As-
e e
sim podemos calcular a fun¸ao risco de cada uma das estrat´gias poss´
c˜ e ıveis.Por
exemplo:
R(δ5 , θ1 ) = L[a2 , θ1 ]p(x1 | θ1 ) + L[a1 , θ1 ]p(x2 | θ1 ) + L[a1 , θ1 ]p(x3 | θ1 )
= 5 × 0, 1 + 2 × 0, 4 + 2 × 0, 5
= 2, 3
5. ˜
10.3. REGRAS DE DECISAO 91
9
8 δ
1 δ
2
7 δ4
6 δ3
δ
6
δ δ8
i,2 5 5
δ
R
7
4
3 0,7Ri,1+0,3Ri,2=3,29
2
1 0,7R +0,3R =2
i,1 i,2
0
0 1 2 3 4 5 6
Ri,1
Figura 10.1: Riscos das diferentes estrat´gias.
e
R(δ, θ) δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8
θ1 2, 0 3, 5 3, 2 4, 7 2, 3 3, 8 3, 5 5, 0
θ2 7, 0 6, 8 6, 6 6, 4 5, 6 5, 4 5, 4 5, 0
Podemos agora comparar as v´rias estrat´gias segundo seus riscos em cada
a e
estado da natureza. Em geral nenhuma estrat´gia vai ser uniformemente menos
e
arriscada nos dois estados (o que seria o ideal). A figura mostra os riscos de
cada estrat´gia de forma gr´fica.
e a
Note que a escolha da melhor estrat´gia n˜o ´ completamente evidente. A
e a e
estrat´gia δ1 ´ a menos arriscada no estado θ1 , j´ a estrat´gia δ8 ´ a menos
e e a e e
arriscada no estado θ2 . Uma possibilidade conservadora de escolha ´ optare
pela estrat´gia cujo maior custo (ou risco) ´ o menor poss´
e e ıvel. Se olharmos
para as estrat´gias veremos que δ8 ´ aquela com o menor pior risco (no caso
e e
5, 0). Esta forma conservadora de escolha surgiu no contexto da teoria dos
jogos e ´ conhecida como princ´
e ıpio minimax. A estrat´gia δ8 cosnsiste em
e
repor os mecanismos em todas as situa¸oes, n˜o importando a dindica¸ao do
c a c˜
cliente sobre a natureza do defeito. Melhor do que o excessivamente pessimista
princ´ıpio minimax ´ utilizarmos novamente a informa¸ao dispon´
e c˜ ıvel sobre a
incidˆncia de cada tipo de defeito, ou seja, a distribui¸ao a priori. Dada certa
e c˜
distribui¸ao a priori podemos calcular o risco m´dio, tamb´m conhecido como
c˜ e e
risco bayesiano, definido como:
r(δ, π) = R(δ, θ1 )π(θ1 ) + R(δ, θ2 )π(θ2 ). (10.2)
Podemos ent˜o optar por aquela estrat´gia commenor risco bayesiano. Se uti-
a e
lizarmos o a priori π(θ2 ) = 0, 3 e π(θ1 ) = 0, 7 mencionado na se¸ao anterior
c˜
temos que:
r = 0, 7Ri,1 + 0, 3Ri,2 (10.3)
ir´ definir uma fam´ de retas. O valor do risco crescendo a medida que estas
a ılia
retas se deslocam para a direita. Aquela estrat´gia que primeiro for cruzada pela
e
6. 92 CAP´ ¸˜ ` ˜
ITULO 10. INTRODUCAO A TEORIA DE DECISAO
reta ser´ a regra de decis˜o de Bayes, ou seja, sera a regra de decis˜o que
a a a
minimiza o risco m´dio dada a distribui¸ao a priori. No nosso caso esta regra
e c˜
´ δ5 que define que devemos tomar nota das reclama¸oes dos consumidores e
e c˜
limpar primeiro os rel´gios, a menos que o consumidor tenha declarado que o
o
rel´gio parou totalmente.
o
10.4 Referˆncias
e
O livro que utilizamos na composi¸ao deste cap´
c˜ ıtulo ´:
e
• Barnett, V., Comparative Statistical Inference, John Wiley & Sons, 1973.