Teoria de Decisão para Manutenção de Relógios

Cap´
ıtulo 10

Introdu¸õ ` Teoria de
ca a
Decisõ
a

10.1 Introdu¸õ
ca
Na situa¸ao geral de decisõ temos v´rias alternativas bem definidas e procu-
c˜ a a
ramos pela melhor a¸ao dado o problema que temos em mõs. Al´m disso
c˜ a e
estamos em uma situa¸ao de incerteza e algumas das informa¸oes importantes
c˜ c˜
para a decisõ sõ desconhecidas.Dependendo do contexto algumas das decis˜es
a a o
tomadas terõ mais m´rito. Este m´rito pode ser medido quantitativamente e
a e e
recebe a denomina¸ao de utilidade. Embora o verdadeiro contexto encontrado
c˜
ap´s decidida a a¸ao seja desconhecido ´ poss´
o c˜ e ıvel coletar informa¸ao que per-
c˜
mita enumerar as possibilidades. A teoria de decisõ permite combinar esta
a
informa¸ao probabil´
c˜ ıstica e empreg´-la na escolha do melhor curso de a¸ao.
a c˜
No que segue ilustraremos a teoria de decisõ em a¸ao utilizando um exemplo
a c˜
simples.

10.2 Problema de Decisõ
a
Suponhamos que n´s sejamos o fabricante de uma linha de rel´gios de pulso
o o
baratos que ´ vendida por uma cadeia de lojas de departamento e supermer-
e
cados. N´s nõ oferecemos garantias contra defeitos aos clientes. No entanto,
o a
como uma forma alternativa de compensa¸ao efetuamos a manuten¸ao de qual-
c˜ c˜
quer rel´gio apenas uma vez mediante ao pagamento de uma pequena taxa.
o
Ao encontrarem algum defeito os consumidores devem devolver o rel´gio pa-
o
gando uma pequena quantia e fornecendo uma explica¸ao do defeito. N´s entõ
c˜ o a
nõ realizamos nenhum trabalho de manuten¸ao detalhado, apenas ou repo-
a c˜
mos o mecanismo completo, ou executamos a limpeza ou ambos. O servi¸o c
de manuten¸ao ´ oferecido como uma forma de rela¸oes p´blicas nõ havendo
c˜ e c˜ u a
inten¸oes comerciais. Obviamente, ´ desej´vel manter os custos desse servi¸o
c˜ e a c

87

88 CAP´ ¸˜ ` ˜
ITULO 10. INTRODUCAO A TEORIA DE DECISAO

no patamar mais baixo poss´ ıvel, sujeito a avalia¸ao de quanto desejamos gastar
` c˜
pelas vantagens promocionais proporcionadas pelo esquema.
Para cada rel´gio precisamos tomar a decisõ de reposi¸ao do mecanismo
o a c˜
ou simples limpeza. Gostar´ ıamos de ser capazes de remediar o problema, se
poss´ıvel, pela alternativa mais barata, a saber, a simples limpeza. Precisamos as-
sim determinar uma estrat´gia de decisõ entre as duas alternativas manuten¸ao
e a c˜
ou limpeza. Precisamos tamb´m determinar a taxa que cobraremos pelo servi¸o.
e c
Esta situa¸ao pode ser organizada utilizando a teoria de decisõ. Considere-
c˜ a
mos o que ocorre quando um rel´gio chega para manuten¸ao. Inicialmente sõ
o c˜ a
poss´ıveis duas a¸oes denotadas a1 e a2 :
c˜

• a1 : limpe o rel´gio primeiro;
o

• a2 : reponha o mecanismo imediatamente.

O conjunto de poss´ ıveis a¸oes ´ denominado o espa¸o de a¸oes e denotado
c˜ e c c˜
A = {a1 , a2 }. Por simplicidade, suponhamos que s´ h´ dois tipos de defeitos:
o a
1. poeira entrou no mecanismo; 2. h´ um problema mecˆnico. Estas sõ as
a a a
circunstˆncias que sõ desconehcidas por n´s quando temos que tomar uma
a a o
decisõ. Estas circunstˆncias podem ser vistas como “estados da natureza”,
a a
atribuindo s´ımbolos:

• θ1 : poeira no mecanismo;

• θ2 : problema mecˆnico.
a

Em analogia ao espa¸o das a¸oes introduzimos tamb´m o espa¸o dos estados
c c˜ e c
{Ω = {θ1 , θ2 }. Equivalentemente, podemos imaginar o espa¸o dos estados como
c
um espa¸o de parˆmetros com o parˆmetro θ apresentando dois valores θ 1 e θ2 .
c a a
Claramente, a¸oes diferentes levarõ a conseq¨ˆncias distintas, dependendo
c˜ a ue
do estado da natureza. Por exemplo, se o mecanismo estiver quebrado (estado
θ2 ) nõ adiantar´ apenas efetuar a limpeza (a¸ao a1 ). Suponha que o custo
a a c˜
da limpeza seja 2 (a unidade monet´ria nõ importa) e que a reposi¸ao custe
a a c˜
5. Podemos entõ construir uma tabela que expresse os custos L(ai , θj ) de
a
cada a¸ao ai sob cada uma das circunstˆncias desconhecidas θj . No nosso caso
c˜ a
teremos a tabela abaixo.

L(ai , θj ) θ1 θ2
a1 2 7
a2 5 5

Note que a limpeza (a1 ) no caso de um rel´gio com mecanismo quebrado (θ2 )
o
tem por conseq¨ˆncia os custos da limpeza (2) e da manuten¸ao (5).
ue c˜
Se soubessemos o estado da natureza para qualquer rel´gio que chegasse
o
a f´brica o problema de decisõ seria trivial: se θ1 (rel´gio sujo) entõ a1
` a a o a
(limpeza), se θ2 (mecanismo quebrado) entõ a2 (reposi¸ao). No entanto, s´
a c˜ o
saberemos o estado da natureza ap´s tomarmos a decisõ. O que devemos
o a
fazer entõ?
a

˜
10.2. PROBLEMA DE DECISAO 89

Suponha que, embora θ nõ seja conhecido para um rel´gio particular, a
a o
experiˆncia nos mostra que cerca de 30% deles apresenta problemas mecˆnicos.
e a
Dessa forma, temos uma probabilidade a priori π(θ2 ) = 0, 3 e, portanto, π(θ1 ) =
0, 7. Esta informa¸ao nos ´ muito util, pois com ela podemos determinar o custo
c˜ e ´
m´dio de tomarmos sempre a a¸ao a1 ou sempre a a¸ao a2 :
e c˜ c˜
L(a1 , θ) θ = 2 × 0, 7 + 7 × 0, 3 = 3, 5
L(a2 , θ) θ = 5 × 0, 7 + 5 × 0, 3 = 5, 0
Assim sendo, no longo prazo seria mais barato executar primeiro a limpeza de
todos os rel´gios que chegassem a f´brica.
o ` a
Note que a estrat´gia mudaria se a probabilidade a priori fosse diferente.
e
Por exemplo, se 70% dos rel´gios recebidos tivessem problemas mecˆnicos (θ 2 )
o a
ter´
ıamos: L(a1 , θ) θ = 5, 5 e L(a2 , θ) θ = 5, 0. A estrat´gia mais barata no
e
longo prazo seria entõ executar a manuten¸ao em todos os rel´gios que fossem
a c˜ o
devolvidos a f´brica.
a
A informa¸ao que temos sobre os estados da natureza na forma da proba-
c˜
bilidade a priori π(θ) nos permite escolher uma a¸ao com a garantia de que em
c˜
´
m´dia minimizaremos o gasto incorrido. E claro que seria muito azar se, por ex-
e
emplo, escolhecemos a a¸ao a2 e um n´mero enorme de rel´gios com poerira no
c˜ u o
mecanismo aparecesse de uma vez. No entanto, devemos lembrar que a teoria de
decisõ se aplica em m´dia. Com a tabela de custos acima podemos determinar
a e
uma distribui¸ao a priori neutra, caracterizada por custos iguais seja qual for a
c˜
a¸ao escolhida. Assim ter´
c˜ ıamos:
L(a1 , θ) θ = L(a2 , θ) θ
2π(θ1 ) + 7[1 − π(θ1 )] = 5π(θ1 ) + 5[1 − π(θ1 )]
π(θ1 ) = 0, 4
Se o prior for neutro teremos custos iguais ( L(a1 , θ) θ = L(a2 , θ) θ = 5, 0 )
nõ importando a a¸ao de nossa escolha.
a c˜
Compliquemos um pouco mais nosso modelo de decisõ. Al´m da informa¸ao
a e c˜
sobre a probabilidade de cada um dos estados da natureza, h´ tamb´m in-
a e
forma¸ao adicional nas reclama¸oes dos consumidores. Suponha que estes dados
c˜ c˜
possam ser divididos em trˆs categorias: o rel´gio parou de funcionar completa-
e o
mente, o rel´gio apresenta um comportamento err´tico, o rel´gio funciona por
o a o
um per´ıodo depois p´ra. Esta informa¸ao est´ dispon´ para cada rel´gio, as-
a c˜ a ıvel o
sim para cada rel´gio temos uma observa¸ao x apresentando uma das seguintes
o c˜
formas:
• x1 : rel´gio parou completamente;
o
• x2 : rel´gio apresenta comportamento err´tico;
o a
• x3 : rel´gio apenas funciona por um per´
o ıodo limitado.
Esta informa¸ao adicional pode dar alguma indica¸ao sobre o estado da na-
c˜ c˜
tureza. O que temos aqui ´ uma fun¸ao de verossimilhan¸a do tipo que j´ en-
e c˜ c a
contramos quando discutimos a inferˆncia bayesiana, temos uma fun¸ao p(x | θ)
e c˜

90 CAP´ ¸˜ ` ˜

que nos dar´ a probabilidade da reclama¸ao x dado o estado do sistema θ. A
a c˜
verossimilhan¸a, em princ´
c ıpio, seria determinada a partir de nossos registros
hist´ricos sobre o processo inteiro, da reclama¸ao a manuten¸ao. Como temos
o c˜ ` c˜
um n´mero discreto de estados e de tipos de reclama¸ao, podemos construir
u c˜
uma tabela contendo os valores assumidos pela fun¸ao de verossimilhan¸a.
c˜ c

p(x | θ) x1 x2 x3
θ1 0, 1 0, 4 0, 5
θ2 0, 7 0, 2 0, 1

Poder´ıamos agora utilizar, ao inv´s da probabilidade a priori, a observa¸ao direta
e c˜
para nossa tomada de decisõ. Uma regra de decisõ ´ uma fun¸ao δ(x) que
a a e c˜
determina uma a¸ao a ser tomada caso observemos x. O objetivo principal da
c˜
teoria de decisõ ´ a obten¸ao de regras de decisõ. Na tabela abaixo listamos
a e c˜ a
todas as regras de decisõ (ou estrat´gias) poss´
a e ıveis:

δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8
x1 a1 a1 a1 a1 a2 a2 a2 a2
x2 a1 a1 a2 a2 a1 a1 a2 a2
x3 a1 a2 a1 a2 a1 a2 a1 a2

10.3 Regras de Decisõ
a
Como poder´ ıamos determinar uma regra de decisõ δ(x) otima? Note que se
a ´
nos basearmos apenas na verossimilhan¸a teremos que x1 d´ suporte a θ2 , que
c a
x2 d´ suporte a θ1 e que x3 d´ suporte a θ1 .,assim dever´
a a ıamos escolher δ5 =
(a2 , a1 , a1 ). Note que δ4 parece uma p´ssima escolha pois provocar´ custos
e a
m´ximos em todas as alternativas! J´ δ1 e δ8 simplesmente ignoram os dados
a a
e decidem sempre da mesma maneira. Perceba que, embora a verossimilhan¸a c
indique que, observado x1 , θ2 ´ mais prov´vel isto nõ implica de forma alguma
e a a
que devemos decidir como se θ2 ocorresse o tempo todo. Tudo depender´ do a
custo m´dio considerando cada um dos poss´
e ıveis estados da natureza θ 1 e θ2 .
Para classificarmos as estrat´gias poss´
e ıveis levando em conta este custo m´dio
e
definimos o risco da estrat´gia:e

R(δ, θ) = L[δ(x), θ]p(x | θ). (10.1)
x

O risco expressa o custo m´dio da regra de decisõ δ(x) dado um particular
e a
estado da natureza θ que ´ apoiado pela evidˆncia fornecida pelo dado x. As-
e e
sim podemos calcular a fun¸ao risco de cada uma das estrat´gias poss´
c˜ e ıveis.Por
exemplo:

R(δ5 , θ1 ) = L[a2 , θ1 ]p(x1 | θ1 ) + L[a1 , θ1 ]p(x2 | θ1 ) + L[a1 , θ1 ]p(x3 | θ1 )
= 5 × 0, 1 + 2 × 0, 4 + 2 × 0, 5
= 2, 3

˜
10.3. REGRAS DE DECISAO 91

9
8 δ
1 δ
2
7 δ4
6 δ3
δ
6
δ δ8
i,2 5 5
δ
R
7
4
3 0,7Ri,1+0,3Ri,2=3,29

2
1 0,7R +0,3R =2
i,1 i,2

0
0 1 2 3 4 5 6
Ri,1

Figura 10.1: Riscos das diferentes estrat´gias.
e

R(δ, θ) δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8
θ1 2, 0 3, 5 3, 2 4, 7 2, 3 3, 8 3, 5 5, 0
θ2 7, 0 6, 8 6, 6 6, 4 5, 6 5, 4 5, 4 5, 0

Podemos agora comparar as v´rias estrat´gias segundo seus riscos em cada
a e
estado da natureza. Em geral nenhuma estrat´gia vai ser uniformemente menos
e
arriscada nos dois estados (o que seria o ideal). A figura mostra os riscos de
cada estrat´gia de forma gr´fica.
e a
Note que a escolha da melhor estrat´gia nõ ´ completamente evidente. A
e a e
estrat´gia δ1 ´ a menos arriscada no estado θ1 , j´ a estrat´gia δ8 ´ a menos
e e a e e
arriscada no estado θ2 . Uma possibilidade conservadora de escolha ´ optare
pela estrat´gia cujo maior custo (ou risco) ´ o menor poss´
e e ıvel. Se olharmos
para as estrat´gias veremos que δ8 ´ aquela com o menor pior risco (no caso
e e
5, 0). Esta forma conservadora de escolha surgiu no contexto da teoria dos
jogos e ´ conhecida como princ´
e ıpio minimax. A estrat´gia δ8 cosnsiste em
e
repor os mecanismos em todas as situa¸oes, nõ importando a dindica¸ao do
c a c˜
cliente sobre a natureza do defeito. Melhor do que o excessivamente pessimista
princ´ıpio minimax ´ utilizarmos novamente a informa¸ao dispon´
e c˜ ıvel sobre a
incidˆncia de cada tipo de defeito, ou seja, a distribui¸ao a priori. Dada certa
e c˜
distribui¸ao a priori podemos calcular o risco m´dio, tamb´m conhecido como
c˜ e e
risco bayesiano, definido como:

r(δ, π) = R(δ, θ1 )π(θ1 ) + R(δ, θ2 )π(θ2 ). (10.2)

Podemos entõ optar por aquela estrat´gia commenor risco bayesiano. Se uti-
a e
lizarmos o a priori π(θ2 ) = 0, 3 e π(θ1 ) = 0, 7 mencionado na se¸ao anterior
c˜
temos que:
r = 0, 7Ri,1 + 0, 3Ri,2 (10.3)
ir´ definir uma fam´ de retas. O valor do risco crescendo a medida que estas
a ılia
retas se deslocam para a direita. Aquela estrat´gia que primeiro for cruzada pela
e

92 CAP´ ¸˜ ` ˜

reta ser´ a regra de decisõ de Bayes, ou seja, sera a regra de decisõ que
a a a
minimiza o risco m´dio dada a distribui¸ao a priori. No nosso caso esta regra
e c˜
´ δ5 que define que devemos tomar nota das reclama¸oes dos consumidores e
e c˜
limpar primeiro os rel´gios, a menos que o consumidor tenha declarado que o
o
rel´gio parou totalmente.
o

10.4 Referˆncias
e
O livro que utilizamos na composi¸ao deste cap´
c˜ ıtulo ´:
e

• Barnett, V., Comparative Statistical Inference, John Wiley & Sons, 1973.

Teoria de Decisão para Manutenção de Relógios

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Andere mochten auch

Andere mochten auch (20)

Ähnlich wie Teoria de Decisão para Manutenção de Relógios

Ähnlich wie Teoria de Decisão para Manutenção de Relógios (7)

Mehr von Renato Vicente

Mehr von Renato Vicente (10)

Kürzlich hochgeladen

Kürzlich hochgeladen (20)

Teoria de Decisão para Manutenção de Relógios