SlideShare ist ein Scribd-Unternehmen logo
1 von 47
VALIDAÇÃO, INTEGRIDADE
E MONITORAMENTO DAS
DOENÇAS
NIGEL PANETH
MEDIDAS DE INTEGRIDADE
TERMINOLOGIA
INTEGRIDADE é análoga à precisão.
VALIDAÇÃO é análoga à segurança da
exatidão.
INTEGRIDADE é como um observador
classifica melhor o mesmo indivíduo sob
diferentes circunstâncias.
VALIDAÇÃO é como uma prova reproduz
melhor um resultado comparado à outra
prova de maior segurança conhecida.
INTEGRIDADE E VALIDAÇÃO
INTEGRIDADE inclui:
• avaliações feitas pelo mesmo observador
em diferentes períodos de tempo –
INTEGRIDADE INTRAOBSERVADOR.
• avaliações feitas por observadores
diferentes ao mesmo tempo –
INTEGRIDADE INTEROBSERVADOR.
INTEGRIDADE presume que todas as provas
e observadores sejam iguais.
VALIDAÇÃO presume que haja um padrão de
ouro com o qual a prova e o observador
serão comparados.
AVALIANDO INTEGRIDADE
Como avaliamos a integridade?
Uma maneira é observar simplesmente a
percentagem de concordância.
- Percentagem de concordância é a
proporção de todos os diagnósticos
classificados da mesma maneira por dois
observadores.
EXEMPLO
São dadas a dois médicos 100
radiografias para analisar
independentemente, e lhes é
perguntado se há a presença de
pneumonia ou não. Quando ambos os
seus diagnósticos são comparados,
encontramos que 95% dos
diagnósticos são os mesmos.
Há integridade nos diagnósticos?
A percentagem de concordância é suficiente
para indicar integridade?
95% de concordância entre os dois médicos
e a ausência ou presença da doença em
uma amostra de 100 pacientes sempre
indica boa concordância?
Você se sentiria tranqüilo se seu hospital
fizesse um constante trabalho de leitura de
Raios X do tórax, e se elas apresentassem
95% de integridade?
COMPARE AS DUAS TABELAS ABAIXO:
TABELA 1 TABELA 2
Em ambos os exemplos, os médicos
concordaram em 95% de vezes. Os dois médicos
são igualmente íntegros nas duas tabelas?
MD ≠1
SIM NÃO
MD≠2
SIM 1 3
NÃO 2 94
MD ≠1
SIM NÃO
MD≠2
SIM 43 3
NÃO 2 52
•QUAL A DIFERENÇA ESSENCIAL ENTRE
AS DUAS TABELAS?
•O problema surge da facilidade de
concordância em eventos comuns
(Ex: não existindo pneumonia na
primeira tabela).
•Uma medida de concordância deverá
levar em consideração a “facilidade” de
concordância devida somente ao acaso.
USO DE KAPPA PARA AVALIAR
INTEGRIDADE
KAPPA é um teste de concordância
INTER e INTRA-observadores (ou
integridade) amplamente utilizado,
que corrige por concordância o
acaso.
KAPPA VARIA DE +1 à -1
+1 significa que os dois observadores
concordaram perfeitamente. Eles
classificaram a todos exatamente da mesma
forma.
0 significa que não existe nenhuma relação
entre as classificações dos dois
observadores, acima da concordância de
acasos que seriam esperadas.
-1 significa que os dois observadores
classificaram exatamente o oposto. Se um
observador diz SIM, o outro sempre diz NÃO.
GUIA PARA USO DE KAPPA EM
EPIDEMIOLOGIA E EM MEDICINA:
KAPPA > 0,80 é considerado excelente.
KAPPA 0,60 – 0,80 é considerado bom.
KAPPA 0,40 – 0,60 é considerado regular.
KAPPA < 0,40 é considerado ruim
PRIMEIRA MANEIRA DE CALCULAR
KAPPA:
1. Calcule a concordância observada
(células nas quais os observadores
concordaram/totais de células). Em
ambas as TABELAS 1 e 2 são de 95%.
2. Calcule a concordância esperada
(acaso de concordância) baseada nas
marginais totais.
OS TOTAIS MARGINAIS
DA TABELA 1 SÃO:
OBSERVADOS MD≠1
SIM NÃO
MD≠2
SIM 1 3 4
NÃO 2 94 96
3 97 100
Como calculamos
o N esperado por
acasos (azar) em
cada célula?
Supondo que cada
célula reflete as
distribuições
marginais, ex: as
proporções das
respostas SIM e
NÃO deverão ser as
mesmas dentro de
uma tabela de
quatro células como
os totais marginais.
OBSERVADOS MD≠1
SIM NÃO
MD≠2
SIM 1 3 4
NÃO 2 94 96
3 97 100
ESPERADOS MD≠1
SIM NÃO
MD≠2
SIM     4
NÃO     96
3 97 100
Para chegar a isso, encontramos a proporção das
respostas em cada coluna (3% e 97%, SIM e NÃO
respectivamente, para MD≠1) ou na coluna (4% e 96%,
SIM e NÃO respectivamente, para MD≠2) dos totais
marginais, e aplicamos uma das duas proporções no
outro total marginal. Ex: 96% dos totais das colunas
na categoria “NÃO”. Portanto, 96% de NÃO por acasos
de MD≠1, deveriam também, estar na coluna de NÃO.
96% de 97 são 93,12.
ESPERADOS MD≠1
SIM NÃO
MD≠2
SIM 4
NÃO 93,12 96
Por subtração, todas as outras células serão
preenchidas automaticamente, e cada distribuição
de células SIM/NÃO refletirá a distribuição margin
Qualquer célula poderá ser usada para fazer o
cálculo, uma vez que, se cada célula é especificada
numa tabela 2X2 com distribuições marginais
fixadas, todas as outras células também, serão
especificadas.
ESPERADOS
MD≠1
SIM NÃO
MD≠2
SIM 0,12 3,88 4
NÃO 2,88 93,12 96
Agora você pode ver que somente por
operação de acaso, 93,24 das 100
observações deveriam ser concordantes
para os dois observadores (93,12 + 0,12)
ESPERADOS
MD≠1
SIM NÃO
MD≠2
SIM 0,12 3,88 4
NÃO 2,88 93,12 96
3 97 100
Agora comparemos a concordância
atual com a concordância esperada:
A concordância esperada é 6,76% distante da
concordância completa de 100%, (100% - 93,24%
= 6,76%).
A concordância atual foi de 5,0% da concordância
completa de 100%, (100% – 95%).
Assim, nossos dois observadores foram 1,76%
melhores que o acaso (azar), mas se eles
tivessem concordado completamente, deveriam
ter sido 6,76% melhores que o acaso (azar). Logo,
eles são melhores em somente cerca de 0,26%
que o acaso (azar) ou seja, 1,76/6,76 ≅¼.
ABAIXO ESTÁ A FÓRMULA PARA
O CÁLCULO DE KAPPA DA
CONCORDÂNCIA (C) ESPERADA:
C. observada – C. esperada
1 – Concordância esperada
95% - 93,24% = 1,76 = 0,26%
1 – 93,24% 6,76
UM KAPPA DE 0,26% É BOM?
KAPPA > 0,80 é considerado excelente.
KAPPA 0,60 – 0,80 é considerado bom.
KAPPA 0,40 – 0,60 é considerado
regular.
KAPPA < 0,40 é considerado ruim.
No segundo exemplo, a concordância
observada foi também, de 95%, mas os
totais marginais foram muito
diferentes.
ATUAL
MD≠1
SIM NÃO
MD≠2
SIM 46
NÃO 54
45 55 100
Calculamos a concordância esperada N,
para qualquer célula, usando o mesmo
procedimento anterior baseado nos totais
marginais. Ex: a célula de valor mais baixo
à direita é 54% de 55, que é 29,7.
ATUAL
MD≠1
SIM NÃO
MD≠2
SIM 46
NÃO 29,7 54
45 55 100
E, por subtração as outras células que
estão abaixo. As células que indicam
concordância estão ressaltadas em
amarelo e somam 54,4%.
ATUAL
MD≠1
SIM NÃO
MD≠2
SIM 20,7 25,3 46
NÃO 24,3 29,7 54
45 55 100
ENTRE AS DUAS CONCORDÂNCIAS (C)
NA FÓRMULA:
Neste exemplo, os observadores têm a
mesma % de concordância, mas agora eles
são muito diferentes do acaso (azar). O
KAPPA de 0,90 é considerado excelente.
C. observada – C. esperada
1 – Concordância esperada
95% - 50,4% = 44,6% = 0,90
1 – 50,4% 49,6%
OUTRA FORMA DE CALCULAR KAPPA:
2(AD – BC)
N1
N4
+ N2
N3
Onde, os valores Ns
são totais marginais,
assim denominados:
MD≠1
SIM NÃO
MD≠2
SIM A B N1
NÃO C D N2
N3
N4
Total
VEJA NOVAMENTE NA TABELA
DO SLIDE 7.
Para a TABELA 1:
2 (94 x 1 – 2 x 3) = 176 = 0,26
4 x 97 + 3 x 96 676
Para a TABELA 2:
2 (52 x 43 – 3 x 2) = 4460 = 0,90
46 x 55 + 45 x 54 4960
NOTE O PARALELISMO ENTRE:
A ODDS RATIO - RAZÃO DE PROBABILIDADES
O QUI-QUADRADO ESTATÍSTICO
O KAPPA ESTATÍSTICO
Note que são centrais nas três expressões
os produtos cruzados das tabelas de
quatro células e suas relações com os
totais marginais.
VALIDAÇÃO E MONITORAMENTO
AS TRÊS MEDIDAS CHAVES DA
VALIDAÇÃO:
SENSIBILIDADE
ESPECIFICIDADE
VALORES PREVISTOS
TABELA DE QUATRO CÉLULAS PARA
AVALIAR A RELAÇÃO DE TESTE-DOENÇA
ESTADOS DE DOENÇA
+ -
RESULTADO
DO
TESTE
+
DOENTE
TESTE
POSITIVO
NÃO
DOENTE
TESTE
POSITIVO
TESTE
NEGATIVO
-
DOENTE
TESTE
NEGATIVO
LIVRE DE
DOENÇA
TESTE
NEGATIVO
TESTE
POSITIVO
DOENTE NÃO
DOENTE
SENSIBILIDADE
Ela nos indica o quanto um teste
positivo detecta a doença.
É definida como a fração dos doentes
com resultados positivos nos testes.
Seus complementos são as taxas dos
testes falso negativos, definidas como
a fração de doentes que dão resultados
negativos nos testes.
A sensibilidade e a taxa de falsos
negativos somam UM.
ESPECIFICIDADE
Nos indica o quanto um teste negativo é
bom para detectar nenhuma doença.
É definida como a fração dos não-doentes
que deram testes negativos.
Seu complemento é a taxa de falsos
positivos definida como a fração dos não-
doentes cuja prova foi positiva.
Especificidade mais a taxa de falsos
positivos dão UM.
VALORES PREVISTOS
VALOR PREVISTO POSITIVO é a proporção de
todas as pessoas com resultados positivos que
têm a doença.
VALOR PREVISTO NEGATIVO é a proporção de
todas as pessoas com resultados negativos que
não têm a doença.
Em geral, o valor previsto positivo é o mais
utilizado. O valor previsto positivo e a
sensibilidade são talvez, os dois parâmetros
mais importantes para o entendimento da
utilização de um teste sob as condições de
campo.
PONTOS CHAVES PARA RELEMBRAR
Sensibilidade, especificidade, falsos positivos e
falsos negativos são todos os denominadores
comuns para doentes e não doentes (utilizamos no
total das colunas).
Ao contrário, os valores previstos são
denominadores para o status do teste, positivo ou
negativo (utilizamos no total das seqüências).
Sensibilidade e especificidade não variam de acordo
com a prevalência da doença na população. Os
valores previstos de um teste, sem dúvida, são
ALTAMENTE DEPENDENTES sob a prevalência da
doença na população.
CALCULANDO SENSIBILIDADE,
ESPECIFICIDADE E OS VALORES
PREVISTOS U
teste é utilizado em 50 pessoas com
uma doença e 50 pessoas sem a doença.
Estes são os resultados:
DOENÇA
+
-
TESTE
+ 48 3 51
- 2 47 49
50 50 100
Sensibilidade = 48/50 x 100 = 96%
Especificidade = 47/50 x 100 = 94%.
Valor previsto positivo = 48/51 x 100 = 94%.
Valor previsto negativo = 47/49 x 100 = 96%.
DOENÇA
+ -
TESTE
+ 48 3 51
- 2 47 49
50 50 100
Agora, vamos aplicar este teste numa
população onde 2% das pessoas têm a
doença, não os 50% como no exemplo
anterior. Suponha que existem 10.000
pessoas, e a mesma sensibilidade e
especificidade anterior, com valores
de 96% e 94% respectivamente.
DOENÇA
+ -
TESTE
+ 192 588 780
- 8 9.212 9.220
200 9.800 10.000
AGORA, QUAL O VALOR POSITIVO
PREVISTO?
192/780 X 100 = 24,6%.
Quando a prevalência de uma doença é de 50%,
94% dos testes positivos indicam a doença. Mas
quando a prevalência é de somente 2%, menor
que 1 em quatro nos resultados dos testes,
estes indicam uma pessoa com a doença, e que
atualmente 2% deveriam apresentar uma doença
comum. Os resultados falsos positivos tendem
a esconder-se em verdadeiros positivos nas
populações, devido a que muitas doenças que
testamos são raras.
MUDANDO O LIMITE DE UM TESTE
Quando a doença é definida por um limiar num
teste contínuo, as características do teste podem
ser alteradas mudando-se o limite ou o PONTO
DE CORTE (CUT-OFF).
Diminuir o limite melhora a sensibilidade, mas
muitas vezes a custo de diminuir a especificidade
(ex: mais falsos positivos).
Aumentar o limite melhora a especificidade, a
custo da diminuição da sensibilidade (ex: mais
falsos negativos).
Isto é especificamente importante quando a
distribuição de uma característica é UNIMODAL,
como a pressão arterial, colesterol, peso, etc
(devido à zona cinza – borderline - ser muito
ampla).
PROBLEMAS DE MONITORAMENTO
•Temos um correto limiar?
•Há um tratamento verdadeiramente efetivo
disponível para a doença diagnosticada?
•Este tratamento é mais efetivo nos casos
monitorados que nós não monitorados?
•Quais são os efeitos adversos do processo de
monitoramento?
•O quanto eficiente é o monitoramento?
Ex: Quantas pessoas têm que ser monitoradas
para se encontrar um caso?
EXEMPLO:
Um ensaio randomizado (aleatório) é
implementado para se avaliar um
programa de monitoramento para o
câncer de colon.
O grupo da intervenção tem
monitoramento regular, o grupo controle
é deixado a mercê de seus próprios
recursos.
APÓS CINCO ANOS
ENCONTRAMOS QUE:
Mais casos são descobertos no grupo
monitorado que no grupo controle.
Os casos são descobertos com antecedência
aos estágios do câncer no grupo monitorado.
A sobrevida a cinco anos é maior nas pessoas
com câncer monitoradas.
Podemos concluir que este programa de
monitoramento é necessariamente efetivo?
NÃO, O PROGRAMA NÃO É
NECESSARIAMENTE EFETIVO.
Os benefícios aparentes só demonstram os
efeitos do RISCO DEPENDENTE DO TEMPO.
Sendo possível diagnosticar uma condição de
forma antecipada, isso não melhorará a sobrevida
depois do diagnóstico; o programa de
monitoramento terá uma super representação de
casos diagnosticados mais cedo, cuja sobrevida
será aumentada por exatamente o tempo em que
seu diagnóstico foi feito de forma mais antecipada
pelo programa de monitoramento.
Assim, eles não serão beneficiados, mas a
quantidade de tempo que eles saberão que têm
câncer terá aumentado.
CONSIDERE COMO O TEMPO DO
DIAGNÓSTICO MUDA COM O
MONITORAMENTO NO CENÁRIO ABAIXO:
GRUPO SEM MONITORAMENTO:
Dx MORTE
IDADE 50 51 52 53 54 55
GRUPO MONITORADO:
Dx MORTE
IDADE 50 51 52 53 54 55
OUTROS RISCOS (BIAS) NO
MONITORAMENTO: RISCO (BIAS)
DE AMPLITUDE DE TEMPO
•Muitas doenças crônicas, especialmente
cânceres, não progridem com a mesma
rapidez em todos os pacientes.
•Qualquer grupo de doentes incluirá alguns
para os quais a doença se desenvolve mais
lentamente e em outros se desenvolve mais
rápido.
•Preferencialmente, o monitoramento incluirá
doenças de desenvolvimento lento (com maior
oportunidade de serem monitoradas) e que
normalmente terá melhor prognóstico.
No cenário anterior, a incidência de doença
é inicialmente mais alta, o diagnóstico é feito
mais cedo, o estagio do diagnóstico é mais
antecipado e a duração da sobrevida desde
o diagnóstico é mais ampla.
Todos eles nos dão a impressão de
benefícios do monitoramento.
Todavia o paciente não é beneficiado, visto
que a morte não é adiada.
A única evidência de efetividade no
programa de monitoramento é uma redução
da morbidade ou mortalidade específica por
total de idade, idealmente demonstrado num
ensaio randomizado (aleatório).
Exercício de mamografia (Mamógrafo)
1. Menos de 50 anos, a sensibilidade é de 75%;
acima dos 50 anos, a sensibilidade é de 90%.
2. Menos de 50 anos, 640 mamografias anormais
foram confirmadas com 17 cânceres, a razão
FP/TP é 623/17 = 36,7.
Acima dos 50 anos, 100 mamografias anormais,
foram confirmadas 14 cânceres; a razão FP/TP é
86/14 = 6,1. Expressando-os como valores
previstos positivos, teremos respectivamente:
17/640 x 100 = 2,7% e 14/100 x 100 = 14%.
Exercício de mamografia
(Mamógrafo) (continuação)
3. Menos de 50 anos, a incidência é de
1,42/1000/ano (baseado em 37 mortes em
10000 em 10 anos).
Acima dos 50 anos, a incidência é de
2,5/1000/ano (baseado em 1/40/10 anos).
MORTALIDADE – 0,67/1000/ano (baseado
em 1/150 em 10 anos).

Weitere ähnliche Inhalte

Was ist angesagt? (9)

Estatistica para instrumental b
Estatistica para instrumental bEstatistica para instrumental b
Estatistica para instrumental b
 
distribuição-t-student
distribuição-t-studentdistribuição-t-student
distribuição-t-student
 
Criterio chauvenet
Criterio chauvenetCriterio chauvenet
Criterio chauvenet
 
Teste de hipoteses
Teste de hipotesesTeste de hipoteses
Teste de hipoteses
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Tópico 2 Intervalo de Confiança
Tópico 2   Intervalo de ConfiançaTópico 2   Intervalo de Confiança
Tópico 2 Intervalo de Confiança
 
Apresentação contabilometria 6
Apresentação contabilometria 6Apresentação contabilometria 6
Apresentação contabilometria 6
 
A distribuição normal
A distribuição normalA distribuição normal
A distribuição normal
 
Cap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição NormalCap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição Normal
 

Ähnlich wie 13991

Ap5 - Critérios de validação dos testes sorológicos
Ap5 - Critérios de validação dos testes sorológicosAp5 - Critérios de validação dos testes sorológicos
Ap5 - Critérios de validação dos testes sorológicosLABIMUNO UFBA
 
Aula Teste Diagnostico - Mestrado PPGMS nov2013
Aula Teste Diagnostico - Mestrado PPGMS nov2013Aula Teste Diagnostico - Mestrado PPGMS nov2013
Aula Teste Diagnostico - Mestrado PPGMS nov2013Vic Fernandes
 
Utilidade dos testes diagnosticos para decisões em saúde
Utilidade dos testes diagnosticos para decisões em saúde Utilidade dos testes diagnosticos para decisões em saúde
Utilidade dos testes diagnosticos para decisões em saúde CONITEC
 
Validação de Testes Diagnósticos (aula 9)
Validação de Testes Diagnósticos (aula 9)Validação de Testes Diagnósticos (aula 9)
Validação de Testes Diagnósticos (aula 9)Sandra Lago Moraes
 
ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico
ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico
ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico Ricardo Portela
 
Validade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESME
Validade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESMEValidade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESME
Validade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESMERilva Lopes de Sousa Muñoz
 
Aula aval testes diagnósticos
Aula aval testes diagnósticosAula aval testes diagnósticos
Aula aval testes diagnósticosDaniela Lima
 
Debora p paula amostragem e rastreabilidade
Debora p paula amostragem e rastreabilidadeDebora p paula amostragem e rastreabilidade
Debora p paula amostragem e rastreabilidadeSofia Iba
 
Seminário sobre Validação 2003
Seminário sobre Validação 2003Seminário sobre Validação 2003
Seminário sobre Validação 2003Adriana Quevedo
 
7 distribição t e comparação de medias
7   distribição t e comparação de medias7   distribição t e comparação de medias
7 distribição t e comparação de mediasFernando Lucas
 
Aula6-TestesdeHipoteses2 (1).pptx
Aula6-TestesdeHipoteses2 (1).pptxAula6-TestesdeHipoteses2 (1).pptx
Aula6-TestesdeHipoteses2 (1).pptxDealthCraft
 
AMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptxAMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptxNunoSilva599593
 
ICSA17 - Critérios de validação imunodiagnóstico
ICSA17 - Critérios de validação imunodiagnósticoICSA17 - Critérios de validação imunodiagnóstico
ICSA17 - Critérios de validação imunodiagnósticoRicardo Portela
 
Critérios de Validação
Critérios de ValidaçãoCritérios de Validação
Critérios de ValidaçãoLABIMUNO UFBA
 

Ähnlich wie 13991 (20)

Ap5 - Critérios de validação dos testes sorológicos
Ap5 - Critérios de validação dos testes sorológicosAp5 - Critérios de validação dos testes sorológicos
Ap5 - Critérios de validação dos testes sorológicos
 
Aula Teste Diagnostico - Mestrado PPGMS nov2013
Aula Teste Diagnostico - Mestrado PPGMS nov2013Aula Teste Diagnostico - Mestrado PPGMS nov2013
Aula Teste Diagnostico - Mestrado PPGMS nov2013
 
Utilidade dos testes diagnosticos para decisões em saúde
Utilidade dos testes diagnosticos para decisões em saúde Utilidade dos testes diagnosticos para decisões em saúde
Utilidade dos testes diagnosticos para decisões em saúde
 
Testesdiagnóstcos22 05
Testesdiagnóstcos22 05Testesdiagnóstcos22 05
Testesdiagnóstcos22 05
 
Validação de Testes Diagnósticos (aula 9)
Validação de Testes Diagnósticos (aula 9)Validação de Testes Diagnósticos (aula 9)
Validação de Testes Diagnósticos (aula 9)
 
Hep 141
Hep 141Hep 141
Hep 141
 
Anova 2__fatores_prof._ivan (2)
Anova  2__fatores_prof._ivan (2)Anova  2__fatores_prof._ivan (2)
Anova 2__fatores_prof._ivan (2)
 
Testes diagnósticos
Testes diagnósticosTestes diagnósticos
Testes diagnósticos
 
ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico
ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico
ICSA17 Imunologia (Prática) - Critérios de validação de ensaios de diagnóstico
 
Validade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESME
Validade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESMEValidade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESME
Validade e Reprodutibilidade de Exames - Profa. Rilva Muñoz - GESME
 
Aula aval testes diagnósticos
Aula aval testes diagnósticosAula aval testes diagnósticos
Aula aval testes diagnósticos
 
Debora p paula amostragem e rastreabilidade
Debora p paula amostragem e rastreabilidadeDebora p paula amostragem e rastreabilidade
Debora p paula amostragem e rastreabilidade
 
Seminário sobre Validação 2003
Seminário sobre Validação 2003Seminário sobre Validação 2003
Seminário sobre Validação 2003
 
7 distribição t e comparação de medias
7   distribição t e comparação de medias7   distribição t e comparação de medias
7 distribição t e comparação de medias
 
Aula6-TestesdeHipoteses2 (1).pptx
Aula6-TestesdeHipoteses2 (1).pptxAula6-TestesdeHipoteses2 (1).pptx
Aula6-TestesdeHipoteses2 (1).pptx
 
Confianca Noemi
Confianca NoemiConfianca Noemi
Confianca Noemi
 
estatisitica basica para saude aula 03
estatisitica basica para saude aula 03 estatisitica basica para saude aula 03
estatisitica basica para saude aula 03
 
AMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptxAMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptx
 
ICSA17 - Critérios de validação imunodiagnóstico
ICSA17 - Critérios de validação imunodiagnósticoICSA17 - Critérios de validação imunodiagnóstico
ICSA17 - Critérios de validação imunodiagnóstico
 
Critérios de Validação
Critérios de ValidaçãoCritérios de Validação
Critérios de Validação
 

Mehr von Claudinei Assis

nocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdf
nocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdfnocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdf
nocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdfClaudinei Assis
 
Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01
Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01
Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01Claudinei Assis
 
37184265 apresentacao-radiacao-na-agroindustria
37184265 apresentacao-radiacao-na-agroindustria37184265 apresentacao-radiacao-na-agroindustria
37184265 apresentacao-radiacao-na-agroindustriaClaudinei Assis
 
45426615 irradiacao-de-alimentos
45426615 irradiacao-de-alimentos45426615 irradiacao-de-alimentos
45426615 irradiacao-de-alimentosClaudinei Assis
 
2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrc
2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrc2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrc
2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrcClaudinei Assis
 

Mehr von Claudinei Assis (9)

MARC21.pdf.pdf
MARC21.pdf.pdfMARC21.pdf.pdf
MARC21.pdf.pdf
 
nocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdf
nocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdfnocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdf
nocoes_basicas_de_biblioteconomia_auxiliar_de_biblioteca (1).pdf
 
607 1554-2-pb
607 1554-2-pb607 1554-2-pb
607 1554-2-pb
 
Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01
Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01
Propostadeatividadesparaumabibliotecadinmica 120522160040-phpapp01
 
Radiologia industrial
Radiologia industrialRadiologia industrial
Radiologia industrial
 
37184265 apresentacao-radiacao-na-agroindustria
37184265 apresentacao-radiacao-na-agroindustria37184265 apresentacao-radiacao-na-agroindustria
37184265 apresentacao-radiacao-na-agroindustria
 
45426615 irradiacao-de-alimentos
45426615 irradiacao-de-alimentos45426615 irradiacao-de-alimentos
45426615 irradiacao-de-alimentos
 
Tese anderson
Tese andersonTese anderson
Tese anderson
 
2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrc
2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrc2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrc
2012 samsung tv_manual_de_atualizacao_de_firmware_t-mst9_ibrc
 

13991

  • 1. VALIDAÇÃO, INTEGRIDADE E MONITORAMENTO DAS DOENÇAS NIGEL PANETH
  • 2. MEDIDAS DE INTEGRIDADE TERMINOLOGIA INTEGRIDADE é análoga à precisão. VALIDAÇÃO é análoga à segurança da exatidão. INTEGRIDADE é como um observador classifica melhor o mesmo indivíduo sob diferentes circunstâncias. VALIDAÇÃO é como uma prova reproduz melhor um resultado comparado à outra prova de maior segurança conhecida.
  • 3. INTEGRIDADE E VALIDAÇÃO INTEGRIDADE inclui: • avaliações feitas pelo mesmo observador em diferentes períodos de tempo – INTEGRIDADE INTRAOBSERVADOR. • avaliações feitas por observadores diferentes ao mesmo tempo – INTEGRIDADE INTEROBSERVADOR. INTEGRIDADE presume que todas as provas e observadores sejam iguais. VALIDAÇÃO presume que haja um padrão de ouro com o qual a prova e o observador serão comparados.
  • 4. AVALIANDO INTEGRIDADE Como avaliamos a integridade? Uma maneira é observar simplesmente a percentagem de concordância. - Percentagem de concordância é a proporção de todos os diagnósticos classificados da mesma maneira por dois observadores.
  • 5. EXEMPLO São dadas a dois médicos 100 radiografias para analisar independentemente, e lhes é perguntado se há a presença de pneumonia ou não. Quando ambos os seus diagnósticos são comparados, encontramos que 95% dos diagnósticos são os mesmos.
  • 6. Há integridade nos diagnósticos? A percentagem de concordância é suficiente para indicar integridade? 95% de concordância entre os dois médicos e a ausência ou presença da doença em uma amostra de 100 pacientes sempre indica boa concordância? Você se sentiria tranqüilo se seu hospital fizesse um constante trabalho de leitura de Raios X do tórax, e se elas apresentassem 95% de integridade?
  • 7. COMPARE AS DUAS TABELAS ABAIXO: TABELA 1 TABELA 2 Em ambos os exemplos, os médicos concordaram em 95% de vezes. Os dois médicos são igualmente íntegros nas duas tabelas? MD ≠1 SIM NÃO MD≠2 SIM 1 3 NÃO 2 94 MD ≠1 SIM NÃO MD≠2 SIM 43 3 NÃO 2 52
  • 8. •QUAL A DIFERENÇA ESSENCIAL ENTRE AS DUAS TABELAS? •O problema surge da facilidade de concordância em eventos comuns (Ex: não existindo pneumonia na primeira tabela). •Uma medida de concordância deverá levar em consideração a “facilidade” de concordância devida somente ao acaso.
  • 9. USO DE KAPPA PARA AVALIAR INTEGRIDADE KAPPA é um teste de concordância INTER e INTRA-observadores (ou integridade) amplamente utilizado, que corrige por concordância o acaso.
  • 10. KAPPA VARIA DE +1 à -1 +1 significa que os dois observadores concordaram perfeitamente. Eles classificaram a todos exatamente da mesma forma. 0 significa que não existe nenhuma relação entre as classificações dos dois observadores, acima da concordância de acasos que seriam esperadas. -1 significa que os dois observadores classificaram exatamente o oposto. Se um observador diz SIM, o outro sempre diz NÃO.
  • 11. GUIA PARA USO DE KAPPA EM EPIDEMIOLOGIA E EM MEDICINA: KAPPA > 0,80 é considerado excelente. KAPPA 0,60 – 0,80 é considerado bom. KAPPA 0,40 – 0,60 é considerado regular. KAPPA < 0,40 é considerado ruim
  • 12. PRIMEIRA MANEIRA DE CALCULAR KAPPA: 1. Calcule a concordância observada (células nas quais os observadores concordaram/totais de células). Em ambas as TABELAS 1 e 2 são de 95%. 2. Calcule a concordância esperada (acaso de concordância) baseada nas marginais totais.
  • 13. OS TOTAIS MARGINAIS DA TABELA 1 SÃO: OBSERVADOS MD≠1 SIM NÃO MD≠2 SIM 1 3 4 NÃO 2 94 96 3 97 100
  • 14. Como calculamos o N esperado por acasos (azar) em cada célula? Supondo que cada célula reflete as distribuições marginais, ex: as proporções das respostas SIM e NÃO deverão ser as mesmas dentro de uma tabela de quatro células como os totais marginais. OBSERVADOS MD≠1 SIM NÃO MD≠2 SIM 1 3 4 NÃO 2 94 96 3 97 100 ESPERADOS MD≠1 SIM NÃO MD≠2 SIM     4 NÃO     96 3 97 100
  • 15. Para chegar a isso, encontramos a proporção das respostas em cada coluna (3% e 97%, SIM e NÃO respectivamente, para MD≠1) ou na coluna (4% e 96%, SIM e NÃO respectivamente, para MD≠2) dos totais marginais, e aplicamos uma das duas proporções no outro total marginal. Ex: 96% dos totais das colunas na categoria “NÃO”. Portanto, 96% de NÃO por acasos de MD≠1, deveriam também, estar na coluna de NÃO. 96% de 97 são 93,12. ESPERADOS MD≠1 SIM NÃO MD≠2 SIM 4 NÃO 93,12 96
  • 16. Por subtração, todas as outras células serão preenchidas automaticamente, e cada distribuição de células SIM/NÃO refletirá a distribuição margin Qualquer célula poderá ser usada para fazer o cálculo, uma vez que, se cada célula é especificada numa tabela 2X2 com distribuições marginais fixadas, todas as outras células também, serão especificadas. ESPERADOS MD≠1 SIM NÃO MD≠2 SIM 0,12 3,88 4 NÃO 2,88 93,12 96
  • 17. Agora você pode ver que somente por operação de acaso, 93,24 das 100 observações deveriam ser concordantes para os dois observadores (93,12 + 0,12) ESPERADOS MD≠1 SIM NÃO MD≠2 SIM 0,12 3,88 4 NÃO 2,88 93,12 96 3 97 100
  • 18. Agora comparemos a concordância atual com a concordância esperada: A concordância esperada é 6,76% distante da concordância completa de 100%, (100% - 93,24% = 6,76%). A concordância atual foi de 5,0% da concordância completa de 100%, (100% – 95%). Assim, nossos dois observadores foram 1,76% melhores que o acaso (azar), mas se eles tivessem concordado completamente, deveriam ter sido 6,76% melhores que o acaso (azar). Logo, eles são melhores em somente cerca de 0,26% que o acaso (azar) ou seja, 1,76/6,76 ≅¼.
  • 19. ABAIXO ESTÁ A FÓRMULA PARA O CÁLCULO DE KAPPA DA CONCORDÂNCIA (C) ESPERADA: C. observada – C. esperada 1 – Concordância esperada 95% - 93,24% = 1,76 = 0,26% 1 – 93,24% 6,76
  • 20. UM KAPPA DE 0,26% É BOM? KAPPA > 0,80 é considerado excelente. KAPPA 0,60 – 0,80 é considerado bom. KAPPA 0,40 – 0,60 é considerado regular. KAPPA < 0,40 é considerado ruim.
  • 21. No segundo exemplo, a concordância observada foi também, de 95%, mas os totais marginais foram muito diferentes. ATUAL MD≠1 SIM NÃO MD≠2 SIM 46 NÃO 54 45 55 100
  • 22. Calculamos a concordância esperada N, para qualquer célula, usando o mesmo procedimento anterior baseado nos totais marginais. Ex: a célula de valor mais baixo à direita é 54% de 55, que é 29,7. ATUAL MD≠1 SIM NÃO MD≠2 SIM 46 NÃO 29,7 54 45 55 100
  • 23. E, por subtração as outras células que estão abaixo. As células que indicam concordância estão ressaltadas em amarelo e somam 54,4%. ATUAL MD≠1 SIM NÃO MD≠2 SIM 20,7 25,3 46 NÃO 24,3 29,7 54 45 55 100
  • 24. ENTRE AS DUAS CONCORDÂNCIAS (C) NA FÓRMULA: Neste exemplo, os observadores têm a mesma % de concordância, mas agora eles são muito diferentes do acaso (azar). O KAPPA de 0,90 é considerado excelente. C. observada – C. esperada 1 – Concordância esperada 95% - 50,4% = 44,6% = 0,90 1 – 50,4% 49,6%
  • 25. OUTRA FORMA DE CALCULAR KAPPA: 2(AD – BC) N1 N4 + N2 N3 Onde, os valores Ns são totais marginais, assim denominados: MD≠1 SIM NÃO MD≠2 SIM A B N1 NÃO C D N2 N3 N4 Total
  • 26. VEJA NOVAMENTE NA TABELA DO SLIDE 7. Para a TABELA 1: 2 (94 x 1 – 2 x 3) = 176 = 0,26 4 x 97 + 3 x 96 676 Para a TABELA 2: 2 (52 x 43 – 3 x 2) = 4460 = 0,90 46 x 55 + 45 x 54 4960
  • 27. NOTE O PARALELISMO ENTRE: A ODDS RATIO - RAZÃO DE PROBABILIDADES O QUI-QUADRADO ESTATÍSTICO O KAPPA ESTATÍSTICO Note que são centrais nas três expressões os produtos cruzados das tabelas de quatro células e suas relações com os totais marginais.
  • 28. VALIDAÇÃO E MONITORAMENTO AS TRÊS MEDIDAS CHAVES DA VALIDAÇÃO: SENSIBILIDADE ESPECIFICIDADE VALORES PREVISTOS
  • 29. TABELA DE QUATRO CÉLULAS PARA AVALIAR A RELAÇÃO DE TESTE-DOENÇA ESTADOS DE DOENÇA + - RESULTADO DO TESTE + DOENTE TESTE POSITIVO NÃO DOENTE TESTE POSITIVO TESTE NEGATIVO - DOENTE TESTE NEGATIVO LIVRE DE DOENÇA TESTE NEGATIVO TESTE POSITIVO DOENTE NÃO DOENTE
  • 30. SENSIBILIDADE Ela nos indica o quanto um teste positivo detecta a doença. É definida como a fração dos doentes com resultados positivos nos testes. Seus complementos são as taxas dos testes falso negativos, definidas como a fração de doentes que dão resultados negativos nos testes. A sensibilidade e a taxa de falsos negativos somam UM.
  • 31. ESPECIFICIDADE Nos indica o quanto um teste negativo é bom para detectar nenhuma doença. É definida como a fração dos não-doentes que deram testes negativos. Seu complemento é a taxa de falsos positivos definida como a fração dos não- doentes cuja prova foi positiva. Especificidade mais a taxa de falsos positivos dão UM.
  • 32. VALORES PREVISTOS VALOR PREVISTO POSITIVO é a proporção de todas as pessoas com resultados positivos que têm a doença. VALOR PREVISTO NEGATIVO é a proporção de todas as pessoas com resultados negativos que não têm a doença. Em geral, o valor previsto positivo é o mais utilizado. O valor previsto positivo e a sensibilidade são talvez, os dois parâmetros mais importantes para o entendimento da utilização de um teste sob as condições de campo.
  • 33. PONTOS CHAVES PARA RELEMBRAR Sensibilidade, especificidade, falsos positivos e falsos negativos são todos os denominadores comuns para doentes e não doentes (utilizamos no total das colunas). Ao contrário, os valores previstos são denominadores para o status do teste, positivo ou negativo (utilizamos no total das seqüências). Sensibilidade e especificidade não variam de acordo com a prevalência da doença na população. Os valores previstos de um teste, sem dúvida, são ALTAMENTE DEPENDENTES sob a prevalência da doença na população.
  • 34. CALCULANDO SENSIBILIDADE, ESPECIFICIDADE E OS VALORES PREVISTOS U teste é utilizado em 50 pessoas com uma doença e 50 pessoas sem a doença. Estes são os resultados: DOENÇA + - TESTE + 48 3 51 - 2 47 49 50 50 100
  • 35. Sensibilidade = 48/50 x 100 = 96% Especificidade = 47/50 x 100 = 94%. Valor previsto positivo = 48/51 x 100 = 94%. Valor previsto negativo = 47/49 x 100 = 96%. DOENÇA + - TESTE + 48 3 51 - 2 47 49 50 50 100
  • 36. Agora, vamos aplicar este teste numa população onde 2% das pessoas têm a doença, não os 50% como no exemplo anterior. Suponha que existem 10.000 pessoas, e a mesma sensibilidade e especificidade anterior, com valores de 96% e 94% respectivamente. DOENÇA + - TESTE + 192 588 780 - 8 9.212 9.220 200 9.800 10.000
  • 37. AGORA, QUAL O VALOR POSITIVO PREVISTO? 192/780 X 100 = 24,6%. Quando a prevalência de uma doença é de 50%, 94% dos testes positivos indicam a doença. Mas quando a prevalência é de somente 2%, menor que 1 em quatro nos resultados dos testes, estes indicam uma pessoa com a doença, e que atualmente 2% deveriam apresentar uma doença comum. Os resultados falsos positivos tendem a esconder-se em verdadeiros positivos nas populações, devido a que muitas doenças que testamos são raras.
  • 38. MUDANDO O LIMITE DE UM TESTE Quando a doença é definida por um limiar num teste contínuo, as características do teste podem ser alteradas mudando-se o limite ou o PONTO DE CORTE (CUT-OFF). Diminuir o limite melhora a sensibilidade, mas muitas vezes a custo de diminuir a especificidade (ex: mais falsos positivos). Aumentar o limite melhora a especificidade, a custo da diminuição da sensibilidade (ex: mais falsos negativos). Isto é especificamente importante quando a distribuição de uma característica é UNIMODAL, como a pressão arterial, colesterol, peso, etc (devido à zona cinza – borderline - ser muito ampla).
  • 39. PROBLEMAS DE MONITORAMENTO •Temos um correto limiar? •Há um tratamento verdadeiramente efetivo disponível para a doença diagnosticada? •Este tratamento é mais efetivo nos casos monitorados que nós não monitorados? •Quais são os efeitos adversos do processo de monitoramento? •O quanto eficiente é o monitoramento? Ex: Quantas pessoas têm que ser monitoradas para se encontrar um caso?
  • 40. EXEMPLO: Um ensaio randomizado (aleatório) é implementado para se avaliar um programa de monitoramento para o câncer de colon. O grupo da intervenção tem monitoramento regular, o grupo controle é deixado a mercê de seus próprios recursos.
  • 41. APÓS CINCO ANOS ENCONTRAMOS QUE: Mais casos são descobertos no grupo monitorado que no grupo controle. Os casos são descobertos com antecedência aos estágios do câncer no grupo monitorado. A sobrevida a cinco anos é maior nas pessoas com câncer monitoradas. Podemos concluir que este programa de monitoramento é necessariamente efetivo?
  • 42. NÃO, O PROGRAMA NÃO É NECESSARIAMENTE EFETIVO. Os benefícios aparentes só demonstram os efeitos do RISCO DEPENDENTE DO TEMPO. Sendo possível diagnosticar uma condição de forma antecipada, isso não melhorará a sobrevida depois do diagnóstico; o programa de monitoramento terá uma super representação de casos diagnosticados mais cedo, cuja sobrevida será aumentada por exatamente o tempo em que seu diagnóstico foi feito de forma mais antecipada pelo programa de monitoramento. Assim, eles não serão beneficiados, mas a quantidade de tempo que eles saberão que têm câncer terá aumentado.
  • 43. CONSIDERE COMO O TEMPO DO DIAGNÓSTICO MUDA COM O MONITORAMENTO NO CENÁRIO ABAIXO: GRUPO SEM MONITORAMENTO: Dx MORTE IDADE 50 51 52 53 54 55 GRUPO MONITORADO: Dx MORTE IDADE 50 51 52 53 54 55
  • 44. OUTROS RISCOS (BIAS) NO MONITORAMENTO: RISCO (BIAS) DE AMPLITUDE DE TEMPO •Muitas doenças crônicas, especialmente cânceres, não progridem com a mesma rapidez em todos os pacientes. •Qualquer grupo de doentes incluirá alguns para os quais a doença se desenvolve mais lentamente e em outros se desenvolve mais rápido. •Preferencialmente, o monitoramento incluirá doenças de desenvolvimento lento (com maior oportunidade de serem monitoradas) e que normalmente terá melhor prognóstico.
  • 45. No cenário anterior, a incidência de doença é inicialmente mais alta, o diagnóstico é feito mais cedo, o estagio do diagnóstico é mais antecipado e a duração da sobrevida desde o diagnóstico é mais ampla. Todos eles nos dão a impressão de benefícios do monitoramento. Todavia o paciente não é beneficiado, visto que a morte não é adiada. A única evidência de efetividade no programa de monitoramento é uma redução da morbidade ou mortalidade específica por total de idade, idealmente demonstrado num ensaio randomizado (aleatório).
  • 46. Exercício de mamografia (Mamógrafo) 1. Menos de 50 anos, a sensibilidade é de 75%; acima dos 50 anos, a sensibilidade é de 90%. 2. Menos de 50 anos, 640 mamografias anormais foram confirmadas com 17 cânceres, a razão FP/TP é 623/17 = 36,7. Acima dos 50 anos, 100 mamografias anormais, foram confirmadas 14 cânceres; a razão FP/TP é 86/14 = 6,1. Expressando-os como valores previstos positivos, teremos respectivamente: 17/640 x 100 = 2,7% e 14/100 x 100 = 14%.
  • 47. Exercício de mamografia (Mamógrafo) (continuação) 3. Menos de 50 anos, a incidência é de 1,42/1000/ano (baseado em 37 mortes em 10000 em 10 anos). Acima dos 50 anos, a incidência é de 2,5/1000/ano (baseado em 1/40/10 anos). MORTALIDADE – 0,67/1000/ano (baseado em 1/150 em 10 anos).

Hinweis der Redaktion

  1. Tradução da 7ª parte do curso de EPIDEMIOLOGIA I do Dr. Nigel Paneth, feita por Maria Rita Barros Justino, Farmacêutica Bioquímica, pós-graduada em Imunopatologia pela Pontifícia Universidade Católica do Rio de Janeiro Did you see the first lecture of the course? Você assistiu à primeira aula do curso?
  2. Go to the next lecture &amp;quot;Survival and the life table&amp;quot;