SlideShare ist ein Scribd-Unternehmen logo
1 von 26
Downloaden Sie, um offline zu lesen
1
EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS
Notas
Índice
1. INTRODUCCIÓN 1
2. CLASIFICACIÓN DE ENFERMEDADES POR DIAGNOSIS 1
3. CRITERIOS DE CALIDAD DE LAS PRUEBAS DIAGNÓSTICAS 2
4. TIPOS DE PRUEBAS 3
5. PATRÓN ÁUREO 3
5.1. Diseño de investigación para evaluar una prueba diagnóstica 3
6. PARÁMETROS DE VALORACIÓN DE LAS PRUEBAS DIAGNÓSTICAS 4
6.1. Sensibilidad 5
6.2. Especificidad 5
6.3. Valor predictivo positivo 6
6.4. Valor predictivo negativo 6
6.5. Razones de verosimilitud 7
6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad 8
6.7. Intervalos de confianza para los coeficientes de probabilidad 9
6.8. Variabilidad de las razones de verosimilitud 9
6.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de las pruebas diagnósticas 15
6.10. Falsos positivos frente a falsos negativos. Criterios 19
6.11. Odds ratio diagnóstica 19
6.12. Efectividad de una prueba 20
6.13. Eficiencia diagnóstica de una prueba 20
6.14. El índice de Youden (Y) 20
6.15. El efecto de concentración 21
6.16. Ganancia diagnóstica 22
7. COMENTARIOS 24
8. ETAPAS DE UN ESTUDIO DE EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS 25
9. SESGOS POTENCIALES DE LOS ESTUDIOS SOBRE PRUEBAS DIAGNÓSTICAS25
10. EVALUACIÓN DIAGNÓSTICA: JERARQUIZACIÓN 26
BIBLIOGRAFÍA 26
1. Introducción
Se trata de estudiar aquellos procedimientos estadísticos que permiten evaluar la validez, es decir cuánto se
aproxima una medida al valor real que pretende medir. Son procedimientos muy generales, pero aquí se van
a tratar al hilo del problema de las pruebas diagnósticas (problema muy importante en la práctica y la
investigación clínica): pruebas para determinar si un individuo tiene, o no, una cierta enfermedad (u otra
característica). Hay que resaltar (y no siempre se hace) que si bien la validez de una prueba depende
exclusivamente de la prueba, las estimaciones numéricas que se obtengan de la misma pueden depender
de la prevalencia y de las características clínicas de los pacientes que se hayan estudiado.
2. Clasificación de enfermedades por diagnosis
Debe tenerse muy en cuenta el tipo de enfermedad que se está analizando y el grado de avance de la
misma en el paciente, porque de acuerdo a ello se deberá puntualizar en ciertos aspectos, más que en
otros, como se explicará más adelante. Por ahora, basta con efectuar una primera clasificación de las
enfermedades en tres tipos básicos de acuerdo al siguiente esquema:
2
Tipo I: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el
diagnóstico es un falso negativo.
Tipo II: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el
diagnóstico es un falso positivo.
Tipo III: Son las restantes, donde no se puede clasificar claramente como una de las anteriores.
Las enfermedades que se pueden clasificar como Tipo I son:
• Una enfermedad que es curable si se detecta a tiempo;
• Una enfermedad que es grave y no puede dejarse pasar inadvertida;
• Los falsos positivos no traumatizan ni psicológicamente, ni económicamente al paciente, pero los
diagnósticos falsos negativos sí lo hacen.
Ejemplos: infarto de miocardio, enfermedades venéreas y otras enfermedades infecciosas curables, la
fenilcetonuria, el feocromocitoma (curable en el 100% de los casos sí es detectado a tiempo), cáncer de
mama o de útero, etc.
En cambio, una enfermedad donde para el paciente, un diagnóstico falso positivo es más peligroso que un
falso negativo, se considera como del Tipo II, como ser:
• La enfermedad es grave, pero difícilmente curable o sin remisión;
• Es muy importante para el paciente o para la población él saberse un verdadero negativo;
• Los falsos positivos traumatizan seriamente al paciente, en cambio los falsos negativos no;
• El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente;
Ejemplos: estado terminal o sin remisión de la enfermedad, cáncer oculto, esclerosis en placas, tratamientos
como radioterapia, quimioterapia, lobectomía, cirugía innecesaria, estadio IV de la sífilis cuando ya no tiene
remedio, etc.
Cuando la enfermedad no puede ser encasillada en ninguno de los dos casos anteriores, entonces se la
considera como del Tipo III, como por ejemplo: lupus eritematoso, ciertas formas de leucemia o linfoma,
diabetes, etc. En el caso del SIDA un falso positivo puede ser muy dañino para el paciente, pero un falso
negativo sería muy peligroso para la sociedad y como ambos peligros son graves, lo mejor es clasificarla
como del Tipo III desde un punto de vista ético. Notar que una misma enfermedad puede ser clasificada de
maneras diferentes, de acuerdo al estado de avance que tiene en el paciente. Un cáncer que pueda ser
curado si se detecta a tiempo es un claro caso de Tipo I, pero una vez que se produjo una metástasis en el
paciente pasa a ser del Tipo II.
Lo mismo ocurre con los diferentes estados de la sífilis, que se puede curar si es detectada a tiempo, pero
se torna incurable cuando está muy avanzada.
3. Criterios de calidad de las pruebas diagnósticas
Capacidad de la prueba para medir efectivamente lo que se quiere medir
• Identificación de los enfermos/sujetos sanos
• Enfermo ⇒ Test positivo
• Sujeto sano ⇒ Test negativo
• Test positivo ⇒ Enfermo
• Test negativo ⇒ Sujeto sano
Una prueba diagnóstica es considerada de buena calidad si es capaz de clasificar correctamente a
los miembros de la población a la que se aplica, dando resultados positivos en las personas enfermas y
negativos en las carentes de la enfermedad de estudio. Es un grave error asumir que el resultado de una
prueba diagnóstica es una representación fiel de la situación real de salud de un individuo. Por el contrario,
el médico que reconoce las imperfecciones de una prueba se preguntará: ¿a la vista de este resultado, qué
grado de seguridad tengo acerca del estado de salud de este paciente?
La importancia de una prueba diagnóstica desde el punto de vista de evaluación de tecnologías se basa en
varios factores. Al evaluar una prueba diagnóstica, no obstante, no debe tenerse en cuenta la calidad de la
prueba aisladamente, sino que se deben valorar también las acciones que se van a poner en práctica
cuando el resultado sea anormal. Así, una prueba cuyo resultado no tenga influencia sobre el manejo del
paciente ni sobre su estado de salud, tendrá poca importancia en salud pública, y su evaluación no será
prioritaria.
3
Otros factores que se deben valorar son el precio de la prueba así como su inocuidad, ya que pueden existir
métodos menos invasivos o más económicos para obtener una información suficiente para nuestros
propósitos.
La calidad de una prueba diagnóstica se mide en términos de validez y seguridad. La validez de una
prueba es el grado en que mide lo que se supone debe medir y para determinarla se debe comparar con
otra prueba de probada eficacia en la enfermedad de estudio o con el verdadero resultado en el caso de
que pueda ser conocido. Estos términos de comparación se denominan patrón áureo, “gold standard” o
criterio de referencia. La validez se mide a través de la sensibilidad y la especificidad de la prueba.
La seguridad de una prueba es la capacidad para predecir la presencia o ausencia de enfermedad y se
mide en términos de los valores predictivos, positivo y negativo.
4. Tipos de Pruebas
• Pruebas con respuesta dicotómica (positivo, “+”; negativo, ”–“), por ejemplo, la prueba de embarazo;
• Pruebas con respuesta policotómica, por ejemplo, estadios del cáncer;
• Pruebas con respuesta cuantitativa, por ejemplo, glucosa/diabetes, troponina/IAM. En este caso se
presenta el problema de establecer un punto de corte para dicotomizar la respuesta (“+” o “–“).
5. Patrón áureo
Para identificar la enfermedad se requiere disponer de un diagnóstico de certeza, una prueba de referencia,
lo que se conoce con el nombre de patrón áureo (patrón oro, “gold standard”), para poder ver con respecto
a este patrón la validez de otras pruebas diagnósticas, su calidad, su capacidad para identificar una
enfermedad o para seguir un tratamiento.
Figura 1. Esquema de los estudios de evaluación de pruebas diagnósticas. (1) patrón áureo (gold
standard) válido; (2) comparación independiente; (3) espectro de pacientes adecuado; (4)
descripción completa de los métodos; (5) presentación correcta de los resultados; (6) repercusión
sobre el manejo diagnóstico–terapéutico.
5.1. Diseño de investigación para evaluar una prueba diagnóstica
El modelo apropiado es un diseño descriptivo, en el cual un grupo de participantes con características
determinadas acorde a la prueba a probar es sometido a la prueba y concomitantemente al patrón áureo.
+ –
–
+
Pr(PREPRUEBA)
Pr(POSTPRUEBA)
POBLACION
PATRON DE REFERENCIA
PACIENTE
PRUEBA DIAGNOSTICA
3 2 4
1
5
6
4
Figura 2.
De esta manera, al cabo del estudio se dispondrá de los datos necesarios para completar la tabla de
contingencia, permitiendo calcular todos los indicadores presentados.
Para minimizar los sesgos, se deben considerar algunas premisas claves, a saber:
1. Selección de la muestra: la muestra debe incluir participantes que representen todas las formas clínicas
del daño buscado y respetando la proporción en que la misma se presenta en la práctica cotidiana. Aún
pruebas de escasa capacidad detectan aceptablemente los casos graves al compararlas con los sin daño.
El mayor problema se presenta al intentar detectar a los casos de gravedad moderada a leve. Por ello, la
muestra debe obtenerse desde la presentación consecutiva de casos clínicos que reúnan las características
que los haría pasibles de la indicación de la prueba. Entre ellos, habrá casos de todas las formas clínicas e
incluso casos sin daño.
2. Comparación: la misma debe establecerse con un patrón de referencia apropiado y confiable. El patrón
áureo debe reunir esas características y todos los participantes deben recibir las dos pruebas (la que se
está investigando y el patrón áureo). Es frecuente observar que si se seleccionó un patrón áureo invasivo
y/o costoso, éste se aplique solamente a los que arrojaron un resultado anormal de la prueba en análisis.
Este proceder impide que se completen los datos de la tabla de contingencia, ya que no se dispondría de
los necesarios para llenar los casilleros c ni d y, por lo tanto, se hace imposible calcular sensibilidad ni
especificidad. A este error de procedimiento (o error sistemático o sesgo) se lo denomina error de
verificación (“work-up bias”).
3. Interpretación de los resultados: La lectura del resultado de la prueba analizada debe ser realizada
desconociendo el resultado del patrón áureo, para evitar el sesgo hacia una coincidencia espúrea.
6. Parámetros de valoración de las pruebas diagnósticas
Imaginemos que queremos evaluar una técnica analítica para el diagnóstico de una enfermedad (infecciosa,
por ejemplo). Mediante un procedimiento aleatorio seleccionamos 200 personas que son evaluadas desde
el punto de vista clínico, diagnosticándose 33 personas como enfermas. Tras realizar la prueba en todos
ellos el resultado es el siguiente:
prueba positiva prueba negativa total
pacientes enfermos 27 (VP) 6 (FN) 33 (TE)
pacientes no enfemos 3 (FP) 164 (VN) 167 (TNE)
total 30 (TP) 170 (TN) 200 (T)
Tabla 1
Los 27 pacientes que, estando enfermos, dieron positiva la prueba diagnóstica se consideran verdaderos
positivos (VP). Los seis pacientes enfermos que dieron negativa la prueba de laboratorio son considerados
como falsos negativos (FN). Los tres pacientes no enfermos que dieron positiva la prueba se denominan
falsos positivos (FP). Los 164 pacientes no enfermos que no dieron positivo en la prueba son los verdaderos
negativos (VN).
A continuación se procederá a definir los parámetros de valoración de las pruebas diagnósticas.
Muestra (individuos
consecutivos con
las características
establecidas)
A todos se
efectúa la
prueba y el
patrón áureo
Enfermedad
ausente, la
prueba sugirió su
presencia
Enfermedad
ausente, la
prueba coincidió
Enfermedad
presente
detectada por la
prueba
Enfermedad
presente no
detectada por la
prueba
5
6.1. Sensibilidad
Es el porcentaje de resultados positivos en pacientes con una determinada enfermedad.
Mide el porcentaje de individuos enfermos correctamente diagnosticados
La sensibilidad indica la capacidad de una prueba para detectar a un sujeto enfermo.
La sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquel que realmente lo está.
La sensibilidad expresa cuán "sensible" es la prueba a la presencia de la enfermedad.
Una alta sensibilidad indica un bajo número de falsos negativos.
La sensibilidad sería la probabilidad de que un paciente enfermo diese la prueba positiva o el porcentaje de
positivos de la prueba en pacientes con la enfermedad,
( )
100
%
VP
Sensibilidad
TE
×
=
En el ejemplo la sensibilidad ( )
Se será:
27 100
81,8%
33
Se
×
= =
Una sensibilidad del 81,8 % indica que solo el 81,8 % de los pacientes enfermos darán positiva la prueba.
En este caso habrá un 18,2 % de falsos negativos (pacientes enfermos que han dado negativa la prueba).
Cuanto más sensible es una prueba, más probable es que detecte a las personas con enfermedad. Por ello,
las pruebas con una sensibilidad muy elevada son muy útiles para descartar la presencia de enfermedad.
6.2. Especificidad
Es el porcentaje de resultados negativos en pacientes que no padecen esa enfermedad.
Valora la capacidad de una prueba para detectar correctamente individuos sanos.
La especificidad es la probabilidad de que un individuo sano tenga un resultado negativo.
Una alta especificidad indica una baja frecuencia de falsos positivos.
La especificidad sería la probabilidad de que un paciente sano diese la prueba negativa o el porcentaje de
negatividad de la prueba diagnóstica en ausencia de enfermedad, o:
( )
100
%
VN
Especificidad
TNE
×
=
En el ejemplo la especificidad ( )
Es será:
164 100
98,2%
167
Es
×
= =
Una especificidad del 98,2 % indica que el 98,2 % de los individuos sanos darán negativa la prueba. En este
caso habrá un 1,8 % de falsos positivos (pacientes sanos que han dado positiva la prueba). Las pruebas
muy específicas se usan para confirmar la presencia de una enfermedad. Si la prueba es muy específica y
da positiva, indica la presencia de enfermedad, ya que apenas produce falsos positivos.
Aunque la sensibilidad y la especificidad son dos índices de calidad de la prueba, en la práctica clínica las
preguntas a las que interesa responder son: ¿cuál es la probabilidad de que esté verdaderamente enfermo
si un sujeto ha resultado positivo, ( )
Pr |
E T
+ + ? y, por el contrario, ¿cuál es la probabilidad de que
realmente esté sano si el sujeto resultó negativo en la prueba, ( )
Pr |
E T
− − ? Estas dos probabilidades se
pueden calcular aplicando el teorema de Bayes, siempre que se conozca la probabilidad de que el sujeto
esté enfermo antes de realizar la prueba, o probabilidad preprueba. Si no se dispone de ninguna
información adicional sobre el sujeto, dicha probabilidad será la prevalencia de la patología en la población,
aplicable sólo en el caso de programas de cribado ("screening") sobre la población general, ya que en la
práctica habitual los sujetos candidatos a una prueba diagnóstica lo son por las sospechas deducidas de la
anamnesis o por una sintomatología previa, y por tanto la probabilidad de que padezcan la enfermedad bajo
sospecha será superior a la prevalencia de ésta en la población general.
6
Denominando P a la probabilidad preprueba de padecer la enfermedad, Se a la sensibilidad de la prueba y
Es a su especificidad, las siguientes fórmulas permiten calcular la probabilidad postprueba de que el sujeto
esté enfermo cuando resultó positivo o de que esté sano cuando resultó negativo:
( )
( )( )
( )
( ) ( )
Pr |
1 1
Pr |
1 1
Se P
E T
Se P Es P
Es P
E T
Es P Se P
×
+ + =
× + − −
×
− − =
− + − ×
donde la probabilidad condicional se representa de la forma habitual con el símbolo |
Así ( )
Pr |
E T
+ + significa: suceso E + (enfermo) condicionado a que haya ocurrido el suceso T +
(resultado positivo en la prueba).
Si se calculan estas probabilidades únicamente con los datos de la tabla, la primera de ellas,
( )
Pr |
E T
+ + , a la proporción de sujetos que verdaderamente tienen la enfermedad, de entre los que
dieron positivo, y se conoce como valor predictivo positivo, VPP:
VP
VPP
VP FP
=
+
Igualmente se puede calcular en la tabla la proporción de sujetos verdaderamente sanos sobre el total de
los que dieron negativo, valor predictivo negativo, VPN:
VN
VPN
VN FN
=
+
6.3. Valor predictivo positivo
El valor predictivo positivo es el porcentaje de pacientes enfermos entre todos los pacientes con resultados
positivos. Valora la probabilidad de que una prueba positiva diagnostique correctamente a un individuo
enfermo.
El valor predictivo positivo de una prueba sería la probabilidad de que una prueba positiva correspondiese a
un verdadero enfermo o el porcentaje de pacientes enfermos con resultados positivos con respecto al total
de resultados positivos, o:
( )
100
%
VP
VPP
TP
×
=
En el ejemplo, el VPP será:
27 100
90%
30
VPP
×
= =
Un VPP del 90 % indica que de cada 100 pacientes que dan la prueba positiva solo 90 padecen la
enfermedad, o lo que es lo mismo: si la prueba da positiva, la probabilidad de padecer la enfermedad es de
un 90 %. En este caso habrá un 10 % de individuos sanos diagnosticados incorrectamente como enfermos.
Pero esto no significa que haya un 10 % de falsos positivos.
6.4. Valor predictivo negativo
El valor predictivo negativo Indica la frecuencia de pacientes no enfermos entre todos los pacientes con
resultado negativo. Valora la probabilidad de que una prueba negativa diagnostique correctamente a un
individuo sano. El valor predictivo negativo de una prueba será la probabilidad de que una prueba negativa
diagnosticase correctamente a un individuo sano o el porcentaje de individuos sanos con resultados
negativos con relación al total de resultados negativos, o:
( )
100
%
VN
VPN
TN
×
=
En el ejemplo, el VPN será:
7
164 100
96,5%
170
VPN
×
= =
Un valor predictivo negativo del 96,5 % indica que de cada 100 pruebas negativas, 96,5 pertenecerán a
individuos sanos, o lo que es igual, si la prueba da negativa, la probabilidad de no padecer la enfermedad es
del 96.5 %. En este caso hay un 3,5 % de individuos enfermos que serán diagnosticados erróneamente
como no enfermos. Esto tampoco significa que haya un 3,5 % de falsos negativos.
El intervalo de confianza al 95 % de los valores predictivos se calculan de acuerdo con las siguientes
expresiones:
( )
( )
1
1
VPP VPP
VPP
a b
VPN VPN
VPN
c d
ε
ε
−
±
+
−
±
+
donde 1,96
ε =
Los valores predictivos dependen mucho de la prevalencia de la enfermedad en la población (cociente entre
enfermos y población), no así la sensibilidad y la especificidad, que son independientes de la misma.
Puesto que esos dos índices VPP y VPN son los que interesan en la práctica clínica, parecería natural
utilizarlos como índices de comparación a la hora de evaluar dos métodos diagnósticos diferentes. Sin
embargo presentan un grave inconveniente, ya que si se calculan a partir de la tabla dependen de la
proporción de enfermos en la muestra estudiada. Por ello para una determinada prueba resulta necesario
determinar unos índices de valoración que, respondiendo a las necesidades reales en cuanto a la
clasificación de pacientes, sin embargo no dependan de esa proporción de enfermos en la muestra, tales
como las razones de verosimilitud
6.5. Razones de verosimilitud
Se puede calcular el cociente entre la tasa de verdaderos positivos y la tasa de falsos positivos:
( )
( )
Pr |
Pr |
T E
CP
T NE
+
+ =
+
Este cociente CP + se conoce como cociente de probabilidad positivo o también como cociente de
verosimilitud de una prueba positiva (likelihood ratio of positive test, LR + o L + ), razón de verosimilitud de
una prueba positiva ( )
RV + , razón de verosimilitud de inclusión, potencia (o poder) predictiva de una
prueba positiva, o índice de eficiencia pronóstica ( )
IEP de un resultado positivo. Valores mayores de
CP + indican mejor capacidad para diagnosticar la presencia de enfermedad.
De la misma forma, podemos definir un cociente de probabilidad negativo CP −
( )
( )
Pr |
Pr |
T E
CP
T NE
−
− =
−
Valores de CP − menores indican una mejor capacidad diagnóstica de la prueba (mejor capacidad para
diagnosticar la ausencia de enfermedad).
El cociente de probabilidad negativo también se conoce como cociente de verosimilitud negativo
( )
,
LR λ
− , razón de verosimilitud negativa ( )
RV − , razón de verosimilitud de exclusión, índice de
eficiencia pronóstica de una prueba negativa. El inverso de este cociente se llama poder (o potencia)
predictiva de una prueba negativa.
Se puede determinar unas fórmulas para expresar los cocientes de probabilidad en función de la
sensibilidad Se y de la especificidad Es :
8
1
1
Se
CP
Es
Se
CP
Es
+ =
−
−
− =
La ventaja de los cocientes CP + y CP − frente a los valores predictivos positivo y negativo de la prueba
radica en que, a diferencia de éstos, no dependen de la proporción de enfermos en la muestra, sino tan sólo
de la sensibilidad y especificidad de ésta, de ahí su utilidad a la hora de comparar pruebas diagnósticas.
Además si se conoce o se puede hacer una estimación de la probabilidad preprueba de que un sujeto
padezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba se podrá "corregir" ese
valor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye según que el
resultado sea positivo o negativo, aplicando la siguiente fórmula
( )
Pr
1 1
post
P CP
P CP
×
=
+ −
donde P es la probabilidad preprueba, CP el correspondiente cociente de probabilidad (positivo si
deseamos calcular la probabilidad de que padezca la enfermedad, negativo en caso contrario) y Prpost es la
probabilidad postprueba.
Véase un ejemplo numérico de todo lo anterior:
patología
enfermo ( )
E + no enfermo ( )
E −
positiva ( )
T + 72 100 positivos: 172
prueba
negativa ( )
T − 18 150 negativos: 168
total enfermos: 90 no enfermos: 250 total: 340
Tabla 2
Aplicando las fórmulas anteriores se tiene:
valor estimado intervalo de confianza al 95 %
sensibilidad 0,80 0,72 – 0,88
especificidad 0,60 0,54 – 0,66
CP+ 2,00 1,66 – 2,40
CP– 0,33 0,22 – 0,51
Tabla 3
Evidentemente los valores de los diferentes índices son estimaciones realizadas mediante un experimento
diseñado al efecto, por lo que es necesario calcular algún indicador de su grado de incertidumbre, como
puede ser un intervalo de confianza del 95 %.
6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad
( )
( )
( )
( )
95%
95%
1
1,96
1
1,96
Se Se
IC Se Se
m
Es Es
IC Es Es
n
−
= ±
−
= ±
donde m es el número de enfermos; y
9
n es el número de no enfermos.
Para un intervalo de confianza (IC) del 99 % hay que reemplazar 1,96 por 2,576 y para un IC del 99,9% hay
que reemplazar 1,96 por 3,290
6.7. Intervalos de confianza para los coeficientes de probabilidad
¿Cuán fiables son los coeficientes de probabilidad ( )
CP calculados sobre muestras? Se necesita calcular
su intervalo de confianza que no es fácil para cocientes de probabilidades. Hay varios métodos aproximados
para muestras grandes.
6.7.1. Si el CP es próximo a 1: método de Miettinen
2
2
z
CP
α
χ
±
donde
2
χ es el estadístico de asociación de la tabla 2 x 2.
Por ejemplo, para
2
0,2
χ = , el intervalo de confianza al 95 % es ( )
1,96
0,2
1,02 0,92 , 1,09
±
=
6.7.2. Si el CP no es próximo a 1: aproximación de primer orden del desarrollo de Taylor
[ ]( )
( )
[ ]( )
( )
2
2
1
ln
1
ln
1 %
1 %
Se Es
CP z
d c
Se Es
CP z
b a
IC CP e
IC CP e
α
α
α
α
−
+ ± +
−
− ± +
+ − =
− − =
Si se comparan dos pruebas diagnósticas A y B , se calculan sus cocientes de probabilidad positivos, y se
observa que A B
CP CP
+ > + , se podrá afirmar que la prueba A es mejor que la B para confirmar la
presencia de enfermedad. Si en cuanto a los cocientes de probabilidad negativos se observa que
A B
CP CP
−< − se podrá afirmar que la prueba A es mejor que la B para confirmar la ausencia de
enfermedad.
6.8. Variabilidad de las razones de verosimilitud
La incidencia de las razones de verosimilitud sobre los valores predictivos y sobre la utilización diagnóstica
de los signos y de las pruebas es tal que resulta útil analizar aunque sea brevemente, el respectivo papel de
sus dos componentes, sensibilidad y especificidad.
Si la especificidad es constante, las razones de verosimilitud positivas
1
Se
L
Es
=
−
son función lineal de la
sensibilidad. Cuando la sensibilidad aumenta, L aumenta en la misma proporción.
La razón de verosimilitud negativa
1 Es
Se
λ
−
= es igualmente una función lineal de la sensibilidad, pero
negativa: cuando aumenta la sensibilidad, λ disminuye en la misma proporción (Figura 3)
10
Figura 3. Variación de la razón de verosimilitud en función de la sensibilidad para diferentes pruebas
cuya especificidad es igual a 0,90.
Cuando 1 0,1
Se Es
= − = , las dos razones de verosimilitud son iguales a 1 la prueba no tiene ningún valor
diagnóstico. El valor diagnóstico del resultado –positivo o negativo– de la prueba crece linealmente cuando
la sensibilidad aumenta de 0,10 a 1,00.
Figura 4. Variación de las razones de verosimilitud en función de la especificidad para diferentes
pruebas cuya sensibilidad es igual a 0.80
11
Cuando 1 0,8
Es Se
= − = , las dos razones de verosimilitud son iguales a 1 y por lo tanto en esta situación la
prueba carece de utilidad diagnóstica. Se nota que la progresión de L es muy rápida cuando la
especificidad es superior a 0,7. La razón de verosimilitud negativa se modifica poco cuando Es crece de
0,50 a 1,00, mientras que la razón de verosimilitud positiva L se afectada mucho por variaciones mínimas
de la especificidad cuando ésta es muy elevada; así, cuando Es crece de 0,90 a 0,95, L pasa de 8 a 16.
Si la sensibilidad es constante, las dos razones de verosimilitud son funciones hiperbólicas de la
especificidad. La razón de verosimilitud positiva L , en particular, crece muy rápidamente y tiende hacia el
infinito cuando la especificidad de una prueba –o de un grupo de pruebas– tiende hacia 1.
Se dice que la eficacia diagnóstica de una prueba, en la investigación de una enfermedad determinada E ,
está estrechamente ligada al crecimiento de su especificidad, cualidad que, precisamente, es estable en el
caso de los sujetos no afectados por la enfermedad E
Comparando los cocientes de probabilidad de dos pruebas diagnósticas existen cuatro posibles resultados
que podemos reflejar en una gráfica. En el eje de las Y representamos la sensibilidad, en el eje de las X
se representa (1−especificidad). El punto representa los valores de sensibilidad y (1−especificidad)
observados para la prueba A . Se traza una línea desde el origen (0,0) que pase por el punto A y otra
desde el valor (1,1) que también pase por ese punto, quedando dividido el gráfico en cuatro zonas como se
ve en la Figura 5, de tal manera que cualquier otra prueba cuyo resultado representemos en esa gráfica
estará en alguna de las cuatro zonas
Figura 5. Las zonas corresponden a las siguientes situaciones: 1: en esta región la prueba B es
siempre superior a la A, tanto para confirmar presencia como ausencia de enfermedad; 2: aquí la
prueba B sólo es superior a la A para confirmar ausencia de enfermedad; 3: en esta zona B siempre
es inferior a A; 4: si el resultado de B está en este área, será superior a A para confirmar la presencia
de enfermedad.
Supóngase ahora que se desea comparar la prueba A con otra prueba B cuya sensibilidad es 0,9 y
especificidad 0,5. Representándolo en la Figura 6 se obtiene:
12
Figura 6. B cae en la zona 2 por lo que es una prueba mejor que A para confirmar la ausencia de
enfermedad, como se puede determinar también numéricamente al calcular los correspondientes
cocientes de probabilidad CP+ = 1,8 y CP− = 0,2.
Todas estas consideraciones se refieren únicamente a la capacidad discriminatoria de una prueba. La
decisión sobre qué prueba diagnóstica es más adecuada, siempre es algo más complicada, puesto que
intervienen otros aspectos, como son el coste de la prueba, los riesgos que supone para el paciente, valorar
las consecuencias que conlleva un falso positivo o un falso negativo...
Evidentemente para comparar los parámetros de dos pruebas diagnósticas habrá que considerar que los
valores obtenidos sólo son estimaciones y están sometidos por tanto a posibles errores de muestreo, por lo
que habrá que efectuar el correspondiente contraste estadístico para determinar si las diferencias
encontradas son suficientemente importantes como para no poder ser atribuidas al azar.
Si la razón de verosimilitud es igual a 1, la probabilidad del diagnóstico es la misma antes y después de
aplicar la prueba. En este caso la prueba es inútil, no tiene capacidad discriminante. Cuanto más se aleje de
1 el valor de la razón de verosimilitud, mas interés presenta la prueba.
10 0,1
CP ó CP
+ > −< Generan cambios amplios y a menudo concluyentes desde una
probabilidad preprueba hasta una probabilidad postprueba
5 10 0,1 0,2
CP y CP
< +< < −< Generan cambios moderados desde la probabilidad preprueba hasta la
probabilidad postprueba
2 5 0,05 0,2
CP y CP
< +< < −< Generan cambios pequeños (pero en ocasiones importantes) de la
probabilidad
1 2 0,5 1
CP y CP
< +< < −< Alteran la probabilidad en un grado insignificante (y rara vez
importante).
Tabla 4. Interpretación de los cocientes de probabilidad (según el Evidence-based Medicine Working
Group)
Ventajas de la razón de verosimilitud
• Es independiente de la prevalencia;
• Es un buen reflejo del valor de la prueba cualquiera que sea el grupo al que se aplique;
• Resumen la información en sólo parámetro;
13
• Utilizable para diferentes niveles de resultados de una prueba. Para cada nivel procura una información
diferente permitiendo interpretar mejor los resultados de la prueba;
• Permite calcular de manera individual el interés de realizar la prueba a partir de la probabilidad inicial de
la enfermedad del paciente.
Los cocientes de probabilidad permiten transformar la probabilidad preprueba en probabilidad postprueba
mediante la relación:
post R pre
odds CP odds
= ×
Recuérdese que se denomina oddsi al cociente entre la probabilidad de que un evento (en este caso “estar
enfermo”) ocurra y la probabilidad de que no ocurra, por lo tanto:
1 1
p odds
odds p
p odds
= ⇒ =
− +
los subíndices post y pre indican postprueba y preprueba respectivamente y el subíndice R representa el
resultado obtenido.
En el caso del siguiente ejemplo:
ecocardiograma péptido natriurético tipo B (pmol/L)
normal ( <18,7) elevado (≥ 18,7) total
normal a 93 b 50 r = a + b 143
disfunción c 1 d 11 s = c + d 12
total t = a + c 94 u = b + d 61 N = a + b + c + d 155
Tabla 5. Resultados de la evaluación del péptido natriurético tipo B
1
1
d
Se d r
s
CP
b
Es b s
r
c
Se c r
s
CP
a
Es a s
r
×
+ = = =
− ×
− ×
− = = =
×
Los CP de la prueba del ejemplo son
11 143
2,62
50 12
1 143
0,13
93 12
d r
CP
b s
c r
CP
a s
× ×
+ = = =
× ×
× ×
− = = =
× ×
supóngase que se le aplica la prueba a un anciano al que por su sintomatología e historia se le estima una
probabilidad alta (por ejemplo, 0,7) de padecer disfunción ventricular izquierda ¿cómo se modificaría esta
probabilidad si se le midiera la concentración plasmática del péptido y resultara positiva ( ≥ 18,7)? A partir
de la probabilidad preprueba, primero se calcula el
0,7
2,33
1 0,7
pre
odds = =
−
; como el resultado es positivo
2,62
CPR CP
= + = , por tanto 2,62 2,33 6,10
post
odds = × = y ( )
6,10
Pr 0,86
7,10
post = = ; si el resultado de
la prueba hubiera sido negativo 0,13
CPR CP
= −= y 0,13 2,33 0,30
post
odds = × = y por lo tanto
( )
0,30
Pr 0,23
1,30
post = = .
14
Figura 7. Nomograma de Fagan (Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975;
293(5): 257)
Fagan (1975) describió un nomograma para el teorema de Bayes, basado en la capacidad de convertir el
teorema de Bayes en una función sumatoria lineal simple. Con un par de trucos matemáticos se puede
conseguir esto. Primero, se necesita la versión de probabilidad del teorema de Bayes:
" " " "
Odds postprueba Odds preprueba CP
= ×
o de forma simbólica:
( )
Pr
Pr
R
E E
O O E
R
R
E
 
 
   
=
 
 
 
 
 
Donde E representa enfermedad;
E representa ausencia de enfermedad; y
R es un resultado específico de la prueba.
Tomando logaritmos, se convierte en una simple suma:
( ) ( ) ( )
log " " log " " log
Odds postprueba Odds preprueba CP
= +
o de forma simbólica:
( )
( )
Pr
log log log
Pr
R
E E
O O E
R
R
E
 
 
 
 
 
   
 
= +
 
 
 
 
 
 
 
 
 
 
o también:
( ) ( )
( )
( ) ( )
( ) ( )
Pr Pr
log Pr log Pr log
postprueba preprueba x CP
postprueba preprueba CP
=
= +
15
El nomograma tiene tres columnas: la primera es la probabilidad de tener la enfermedad antes de aplicar la
prueba (prevalencia), la segunda es la razón de verosimilitud ( )
CP y la tercera la probabilidad postprueba
( )
,
PPP VPP . Con una regla se traza una línea entre la probabilidad preprueba y la razón de verosimilitud.
La prolongación de esta línea corta en la tercera columna la probabilidad de tener la enfermedad en función
del resultado de la prueba,
Figura 8. Nomograma de Fagan. Para una prevalencia de 34 % se observa como mejora la
probabilidad postprueba de las variables estudiadas
6.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de las
pruebas diagnósticas
( )
( )( )
( )
( )
Pr |
1 1
1 1
1
1 1
P Se
M S VPP
P Se P Es
P L
VPP
P L
P
VPN
P λ
×
= =
× + − −
×
=
× − +
−
=
× − +
P VPP VPN 1–VPN
1,0 1,0 0,00 1,0
0,95 0,98 0,095 0,905
0,90 0,96 0,18 0,82
0,80 0,92 0,33 0,67
0,70 0,87 0,46 0,54
0,666 0,86 0,50 0,50
0,60 0,82 0,57 0,43
0,50 0,75 0,666 0,33
0,45 0,71 0,71 0,29
0,40 0,67 0,75 0,25
0,30 0,56 0,82 0,18
16
P VPP VPN 1–VPN
0,25 0,50 0,86 0,14
0,20 0,43 0,89 0,11
0,10 0,25 0,95 0,05
0,05 0,14 0,97 0,03
0,01 0,03 0,99 0,01
0,00 0,00 1,00 0,00
Tabla 5. Variación de los valores predictivos de una misma prueba ( )
3 0,50
L y λ
= = cuando P
varía de 1 a 0. ( )
1 VPN
− es la probabilidad de sufrir una enfermedad en presencia de una prueba
negativa.
Figura 9. Variación de los valores predictivos de una prueba cuyas cualidades son
( )
3 0,50
L y λ
= = , cuando la probabilidad preprueba de la enfermedad varía entre 0 y 1
Las curvas de los valores predictivos en función de la probabilidad a priori P son hipérbolas. Los puntos
destacables de estas tres curvas son:
• A donde el valor predictivo positivo es igual a 0,50;
• B donde el valor predictivo negativo es igual a 0,50;
• C donde VPP VPN
= , cuando
1
1
P
Lλ
=
+
Para una misma prueba, cuando P disminuye, VPP disminuye y VPN aumenta. Cuando P aumenta,
VPP aumenta y VPN disminuye.
Se nota que el valor predictivo positivo al principio crece rápidamente cuando la probabilidad preprueba
crece entre 0 y 0,50 y después más lentamente. El VPP es inferior a 0,50 cuando la probabilidad a priori o
preprueba es inferior a 1
1
1
P
L
=
+
, en el ejemplo, donde 3
L= , cuando P es inferior a
1
0,25
1 3
=
+
(Figura
8).
17
Cuando la probabilidad preprueba de la enfermedad E es inferior a
1
1 L
+
, el VPP o probabilidad
postprueba de la enfermedad es inferior al 50 %, incluso si la prueba da un resultado positivo.
El VPN disminuye cuando crece la probabilidad preprueba de la enfermedad. Es inferior a 0,50 cuando P
es inferior a 2
1
1
P
λ
=
+
, en el ejemplo 2
1
0,666
1 0,50
P = =
+
(Figura 8).
Así, cuando la probabilidad primaria es superior a 2
1
1
P
λ
=
+
incluso si la prueba da un resultado negativo,
la probabilidad a posteriori o postprueba de la enfermedad es superior al 50 %.
Los dos valores 1
P y 2
P de la probabilidad primaria, tales que:
1
2
1
1
1
1
P
L
P
λ
=
+
=
+
determinan lo que se puede definir como el intervalo de seguridad de la prueba. En efecto, cuando la
probabilidad primaria se sitúa dentro de este intervalo, un resultado positivo de la prueba da un
VPP superior al 50 % y un resultado negativo da una probabilidad secundaria de la enfermedad inferior al
50 %. Este no es el caso cuando P se sitúa fuera de este intervalo: si P es inferior a 1
P , la probabilidad
postprueba de la enfermedades inferior a 1 cambio sobre dos, incluso si la prueba da un resultado positivo.
Cuando P es superior a 2
P , incluso si el resultado de la prueba es negativo, la probabilidad postprueba de
la enfermedad es todavía superior a 1 cambio sobre 2 ( )
0,50
> . Estas consecuencias matemáticas del
intervalo de seguridad de la probabilidad primaria, tal como está definido por los límites 1
P y 2
P , son de una
importancia capital para la conducta del razonamiento y de la decisión diagnóstica.
Intervalo de seguridad diagnóstica
Figura 10. Comparación de las curvas VPP y VPN de las pruebas “1” y “2” en función de las
variaciones de la probabilidad primaria. Las cualidades diagnósticas respectivas de las dos pruebas
son: para la prueba “1”: 18; 0,105
L λ
= = ; Para la prueba “2”: 3; 0,50
L λ
= = . Se observa que el
intervalo de seguridad diagnóstica para la prueba “1” es mas estrecho que para la prueba “2”.
18
La curva del valor predictivo positivo VPP es tanto mayor cuanto más elevada es L , y la curva del valor
predictivo negativo VPN es tanto menor cuanto más pequeña es λ . El Intervalo de seguridad diagnóstica
es tanto más amplio cuanto más elevada es L y más pequeña λ .
Figura 11. Variaciones de la probabilidad postprueba de la enfermedad E en función de la
probabilidad preprueba P y de las cualidades diagnósticas de la prueba (Sox H.C. Ann Inter Med
1986;104:60-6).
La Figura 11A representa tres pruebas cuya sensibilidad es idéntica, 0,90, y cuyas especificidades son
crecientes, 0,80 para la prueba 1, 0,90 para la prueba 2 y 0,98 para la prueba 3.
En la Figura 11B, las tres pruebas tienen una especificidad idéntica igual a 0,90, y las sensibilidades son
respectivamente 0,60 para la prueba 1, 0,80 para la prueba 2 y 0,95 para la prueba 3.
En la figura 11A, las tres pruebas tienen una sensibilidad idéntica, igual a 090 y una especificidad creciente,
con las cualidades respectivas siguientes:
sensibilidad especificidad L λ
prueba 1 0,90 0,80 4,5 0,125
prueba 2 0,90 0,90 9,0 0,110
prueba 3 0,90 0,98 45,0 0,100
Tabla 6
La figura 11A muestra que para valores bajos de la probabilidad preprueba P , la eficacia diagnóstica del
resultado positivo de la prueba –medida por el VPP – es tanto mas grande cuanto mas elevados son la
especificada y la razón de verosimilitud positiva. En contra, las variaciones de la especificidad modifican
muy poco la consecuencia del resultado negativo: en este caso el efecto de la probabilidad primaria es
predominante.
Las conclusiones inversas resultan de la figura 11B donde las tres pruebas tienen una especificidad idéntica
igual a 0,90 y una sensibilidad creciente:
sensibilidad especificidad L λ
prueba 1 0,60 0,90 6,0 0,44
prueba 2 0,80 0,90 8,0 0,22
prueba 3 0,95 0,90 9,5 0,055
Tabla 7
Las variaciones de la sensibilidad afectan poco los valores predictivos positivos; en cambio, modifican
considerablemente el efecto de un resultado negativo de la prueba, sobre todo cuando la probabilidad
preprueba de la enfermedad es superior a 0,50 ó 0,60.
En suma, cuando la probabilidad preprueba P es baja, un resultado negativo de la prueba tiene poca
incidencia sobre la decisión diagnóstica; el de un resultado positivo de una prueba específica es elevado. Lo
19
inverso ocurre cuando la probabilidad preprueba es elevada: la consecuencias diagnósticas de un resultado
negativo de una prueba sensible es considerable, el de un resultado positivo es débil.
En una situación diagnóstica dada, la elección de una prueba por el clínico está guiada pues por la
probabilidad preprueba de la enfermedad: si el diagnóstico es casi cierto, su confirmación por una prueba
específica modifica muy poco su probabilidad; en cambio, el resultado negativo de una prueba sensible
impondría una revisión seria de la toma de decisiones. Para optimizar la toma de decisiones, el clínico debe
pues elegir una prueba cuya sensibilidad y especificidad sean apropiadas a la probabilidad preprueba de la
enfermedad.
La incidencia del resultado de la prueba sobre el proceso decisional traduce la eficacia diagnóstica de la
prueba. Esta eficacia está medida sobre el efecto de concentración y por la noción de ganancia diagnóstica.
Hasta ahora se ha estudiado el caso de un resultado dicotómico, pero en muchas ocasiones las pruebas
diagnósticas son cuantitativas, sobre todo cuando corresponden a determinaciones analíticas.
Evidentemente, se pueden utilizar todas las consideraciones hechas hasta el momento si se fija un punto de
corte, un valor determinado de la prueba, que marque el límite entre “sano” y “enfermo”. Pero eso no suele
ser una tarea sencilla. Se puede reflejar esquemáticamente en la figura 12:
Figura 12
Existe una zona de posibles resultados de la prueba para la que la distribución de sujetos sanos y enfermos
se solapan. Si se desea aumentar la probabilidad de detectar pacientes enfermos (en la Figura 12
corresponde a mover el punto de corte hacia la izquierda) se ve como también aumentan el número de
falsos positivos. Si se desplaza el punto de corte hacia la derecha, disminuirán los falsos positivos, pero a
costa de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la
especificidad, y viceversa.
6.10. Falsos positivos frente a falsos negativos. Criterios
1. Gravedad o importancia en salud pública. Si el evento puede ser tratado y detectado evitando
complicaciones posteriores han de utilizarse pruebas que minimicen el número de falsos negativos, es
decir, se elegirán pruebas con alta sensibilidad;
2. Coste de las distintas pruebas, exámenes y cuidados médicos y de enfermería requeridos. Si el coste
de todos ellos es alto han de minimizarse el número de falsos positivos, eligiendo pruebas con alta
especificidad;
3. Consecuencias psicosociales. Si la enfermedad diagnosticada conlleva consecuencias al creer que uno
está enfermo por ejemplo en el caso de VIH+ han de minimizarse los falsos positivos, eligiendo pruebas
de alta especificidad;
4. Prevalencia de la enfermedad. Si es baja se ha de maximizar la especificidad para que aumente la
eficiencia del programa.
6.11. Odds ratio diagnóstica
La odds ratio diagnóstica (DOR) es conocida como un índice estadístico en los estudios epidemiológicos
casos/controles representando la fuerza de asociación entre el factor de riesgo y la enfermedad. Aquí podría
20
ser útil para mostrar la fuerza de asociación entre el resultado de una prueba y la enfermedad. Este índice
traduce las prestaciones de una prueba con un solo valor que no está influenciado por la prevalencia.
Es la razón entre la odds de estar enfermo si la prueba da positivo y la odds de no estar enfermo si la
prueba da negativo.
( )
( )
1
1
VPP
VP VPP
CP
FN
DOR
FP VPN
CP
VN VPN
−
+
= = =
−
−
Los valores de la DOR varían de cero a infinito (cuantos más altos son los valores, mejor es la prueba). El
valor 1
DOR = significa que la prueba no es discriminante, es la prueba inútil. Los valores mayores de 1
significan que es más probable que la prueba de positivo en el caso de enfermos que en sanos.
6.12. Efectividad de una prueba
La efectividad de la prueba, cuya distribución es aproximadamente normal, se define como
3 3
ln ln ln
1 1
Se Es CP
Se Es CP
δ
π π
  +
= + =
 
− − −
 
y que puede interpretarse como la diferencia entre las medias de los resultados entre una población de
enfermos y otra de sanos en una escala normalizada. Si 1
δ = la prueba no es efectiva y si 3
δ = es
altamente efectiva.
6.13. Eficiencia diagnóstica de una prueba
Es el porcentaje de pacientes correctamente clasificados, o la probabilidad de que esa prueba diagnóstica
acierte en sus conclusiones:
VP VN
Eficiencia
VP VN FP FN
+
=
+ + +
Si se tiene en cuenta la prevalencia, la expresión sería:
( )
( )
( )
Pr
1 Pr
M Se
Eficiencia
M Es
×
=
− ×
En el caso de que la prevalencia de la enfermedad sea 0,50, sería 0,5 0,5
Eficiencia Se Es
= × + × y
entonces se llamaría eficiencia estándar:
2
Se Es
Eficiencia estándard
+
=
que también se conoce como valor predictivo global y exactitud diagnóstica
6.14. El índice de Youden (Y)
Este índice clínico fue propuesto por Youden (1950) para analizar la capacidad del método de diagnóstico,
usando un único valor en reemplazo de la forma dual de hacerlo (sensibilidad y especificidad). La idea es
mezclar los dos índices anteriores para hacer el estudio de calidad. Se define como:
1
Y Se Es
= + −
Varía de (–1) a (+1). Si es inferior o igual a 0, la prueba no tiene ningún valor informativo. La prueba es tanto
de mejor cuanto el índice de Youden se acerca a 1.
Hay una relación lineal entre este índice y la eficiencia estándar, ya que:
( )
2 1
2
Se Es
Y
+
= −
21
6.15. El efecto de concentración
Se llama “efecto de concentración” al aumenta de la densidad –o de la probabilidad– investigada que es
aportada por el resultado positivo de la prueba. El efecto de la concentración se traduce por la relación:
( )
( )
Pr |
Pr
M T
Probabilidad postprueba de M VPP
Probabilidad preprueba de M M P
+
= =
El efecto de concentración es precioso en situación de cribado de una enfermedad cuya prevalencia es muy
baja en la población estudiada.
Por ejemplo, como el feocromocitoma puede ser una causa, rara, de hipertensión arterial, su investigación
sistemática se aconseja a causa de las posibilidades terapéuticas que aporta la ablación quirúrgica del
tumor. Las pruebas diagnósticas propuestas son la medida de la eliminación urinaria de los derivados
metoxilados de las catecolaminas. Las cualidades diagnósticas de la prueba en caso de los pacientes
hipertensos son sensibilidad = 0,97; especificidad = 0,95 y razón de verosimilitud positiva = 19,4. Si esta
costosa prueba se aplica al conjunto de los sujetos hipertensos donde la prevalencia del feocromocitoma es
0,004
P = , la probabilidad de una causa tumoral cuando la prueba es positiva no rebasa 0,07: por un solo
paciente realmente portador de un tumor, la prueba da pues 13 resultados falsamente positivos. PF Plouin
et al. (1981) han aconsejado aplicar esta prueba bioquímica sólo a los hipertensos que presenten la
siguiente tríada sintomática: cefaleas, palpitaciones y crisis de sudoración. Las cualidades diagnósticas de
la tríada han sido obtenidas sobre una muestra de 2585 sujetos hipertensos.
feocromocitoma
presente ausente
presente 10 160 170
tríada
ausente 1 2414 2415
11 2574 2585
Tabla 8
La presencia de la triada sintomática en el caso de un sujeto hipertenso aumenta la probabilidad del
feocromocitoma a
10
0,06
170
= . La presencia de la triada sintomática tiene pues un “efecto de
concentración” de la probabilidad del feocromocitoma en el caso de tales hipertensos, igual a:
0,06
14,7
0,004
VPP
veces
P
= =
Cuando la prueba bioquímica se aplica entonces a los pacientes seleccionados por este criterio clínico (en
la hipótesis de que se mantengan en este grupo las cualidades diagnósticas establecidas en el conjunto de
los hipertensos) su valor predictivo positivo sería entonces:
( )
0,06 19,4
0,55
0,06 18,4 1
VPP
×
= =
× +
La prueba esta vez es perfectamente aceptable: por cada enfermo diagnosticado, no da mas que un
resultado falsamente positivo, gracias al efecto de concentración provocado por el criterio clínico inicial. El
efecto de concentración obtenido por el conjunto de esta “estrategia secuencial” es igual a
0,55
137,5
0,004
veces
= .
La ausencia de la triada sintomática reduce la probabilidad de feocromocitoma a
1
0,0004
2415
= , es decir a
un nivel 10 veces mas bajo que en el conjunto de los hipertensos.
22
6.16. Ganancia diagnóstica
Se llama ganancia diagnóstica a la diferencia entre la probabilidad preprueba de la enfermedad y la
probabilidad postprueba obtenida por el resultado de la prueba. Si el resultado de la prueba es positivo, la
ganancia diagnóstica ( )
G + se mide por la diferencia
( ) ( ) ( )
Pr | Pr
G E T E VPP P
+ = + + − + = −
Si el resultado de la prueba es negativo, la reducción de la probabilidad de la enfermedad se mide en valor
absoluto por la diferencia
( ) ( ) ( ) ( )
Pr Pr | 1
G E E T P VPN
− = + − + − = − −
El conjunto de la ganancia diagnóstica alcanzada por la aplicación de la prueba, o contenido diagnóstico Γ
(gamma) de la prueba es igual a la suma de estas dos ganancias diagnósticas:
( ) ( )
( ) ( ) ( ) ( )
( ) ( )
Pr | Pr Pr Pr |
Pr | Pr |
G G
E T E E E T
E T E T
Γ = + + −
Γ = + + − + + + − + −
   
   
= + + − + −
El contenido diagnóstico Γ alcanzado por la aplicación de una prueba se mide por la diferencia entre las
dos probabilidades postprueba de la enfermedad, que son obtenidas respectivamente por el resultado
positivo y negativo de la prueba.
Por ejemplo, una prueba con respuesta dicotómica cuyas cualidades diagnósticas son:
0,80
0,90
8
0,222
Se
Es
L
λ
=
=
=
=
es aplicable a la investigación de una enfermedad cuya probabilidad preprueba es 0,30.
Si la respuesta de la prueba es “positiva”, la probabilidad postprueba de la enfermedad se eleva a:
( )
( )
( )
Pr |
1 1
0,30 8
0,77
0,30 7 1
P L
E T VPP
P L
+ + = =
− +
×
= =
× +
La ganancia diagnóstica aportada por la respuesta positiva de la prueba es:
( ) 0,77 0,30 0,47
G VPP P
+ = − = − =
Si la respuesta de la prueba es “negativa”, la probabilidad de la enfermedad baja a:
( )
( )
( )
( )
Pr | 1
1 1
0,30 0,222
0,09
0,30 0,222 1 1
P
E T VPN
P
λ
λ
+ − = − =
− +
×
= =
× − +
La ganancia diagnóstica obtenida por la respuesta negativa de la prueba, en valor absoluto es:
( ) ( )
1 0,30 0,09 0,21
G P VPN
− = − − = − =
Las ganancias diagnósticas se pueden visualizar en la Figura 13. En función de la probabilidad preprueba
P en abscisas, las dos curvas dan los valores de las probabilidades postprueba de la enfermedad E
según que el resultado de la prueba sea positivo (curva superior) o negativo (curva inferior). La ganancia
diagnóstica ( )
G + aportada por el resultado positivo es igual a la distancia OA; la ganancia ( )
G − aportada
por un resultado negativo es igual en valor absoluto a la distancia OB; la ganancia total o contenido
23
diagnóstico Γ de la prueba cuando la probabilidad preprueba es 0,30, es igual a la distancia AB entre las
dos curvas: Γ :
0,47 0,21 0,68
Γ = + =
Figura 13. Ganancia diagnóstica obtenida por la respuesta de una prueba en función de la proba-
bilidad preprueba. La figura muestra que la ganancia diagnóstica obtenida por la prueba tiende a
anularse cuando la probabilidad primaria de la enfermedad se aproxima a los valores extremos 0 y 1.
El cálculo muestra que la ganancia diagnóstica aportada por la respuesta positiva de la prueba es máxima
cuando la probabilidad preprueba es igual a:
( )
1
1
P
L
+ =
+
En el ejemplo, ( )
1
0,26
1 8
P + = =
+
En caso de respuesta negativa, la ganancia diagnóstica es máxima cuando la probabilidad primaria es:
( )
1
1
P
L
+ =
+
En el ejemplo, ( )
1
0,68
1 0,222
P − = =
+
El contenido diagnóstico de la prueba es máximo cuando la probabilidad preprueba de la enfermedad es:
1
1
máx
P
Lλ
=
+
En el ejemplo,
1
0,43
1 8 0,222
máx
P = =
+ ×
.
Esta probabilidad es aquella en que los dos valores predictivos positivo VPP y negativo VPN son iguales.
En el ejemplo, cuando P es igual a 0,43
máx
P = , los dos valores predictivos son 0,86
VPP VPN
= = . Es
cuando la probabilidad preprueba está próxima a valores medianos –próxima al 50 %– cuando la respuesta
de la prueba aporta la información diagnóstica mas elevada (Figura 14). Este valor máx
P de la probabilidad
24
preprueba es 0,50 cuando el producto 1
Lλ = , es decir cuando las dos razones de verosimilitud L y λ son
inversas la una de la otra.
Figura 14. Ganancia diagnóstica en función de la probabilidad preprueba P, aportada por una prueba
cuyas cualidades diagnósticas son L = 8 y λ = 0,222
( )
G + es la ganancia diagnóstica aportada por una respuesta positiva: su valor máximo se obtiene cuando:
1
0,26
1
P
L
− =
+
( )
G − es la ganancia diagnóstica aportada por una respuesta negativa: su valor máximo se obtiene
cuando:
1
0,26
1
P
L
− =
+
Γ es la suma de las dos ganancias, su valor máximo se obtiene cuando:
1
0,43
1
P
L
− =
+
7. Comentarios
Generalmente, sensibilidad y especificidad suelen tener una relación inversa, es decir, si la sensibilidad de
una prueba es muy alta, es a costa de perder especificidad y viceversa.
Cuando para el diagnóstico de una enfermedad existen varias pruebas posibles, la utilización de una u otra
se hará atendiendo a las necesidades diagnósticas. Así en las pruebas de cribado, detección o screening,
se utilizan, en general, pruebas de alta sensibilidad, mientras que en las pruebas de confirmación se utilizan
técnicas de alta especificidad. Las pruebas con una alta sensibilidad se utilizan cuando se quiere
diagnosticar correctamente a los pacientes enfermos. Por ejemplo, en el diagnóstico del cáncer de mama se
utiliza un marcador tumoral específico. Si la paciente tiene cáncer pero la prueba diagnóstica no es capaz
de detectarla, el tumor avanzará rápidamente y provocará un deterioro en la mujer que hará imposible un
tratamiento posterior. Por esta razón la prueba debe detectar a todos los pacientes enfermos, aun a costa
de diagnosticar incorrectamente a alguno sano, pues en las exploraciones complementarias que se realicen
posteriormente, se detectará que el diagnóstico inicial era erróneo.
Las pruebas con una alta especificidad se utilizan cuando se desea diagnosticar correctamente a todos los
individuos sanos. Por ejemplo, en el diagnóstico del embarazo, si la prueba diagnostica incorrectamente a
mujeres no embarazadas, no pasará nada puesto que en pocos días se verá que el diagnóstico era
incorrecto.
25
8. Etapas de un estudio de evaluación de pruebas diagnósticas
Debido a que una misma prueba diagnóstica puede ser utilizada para el estudio de varias situaciones
clínicas (por ejemplo, el diagnóstico por imagen con resonancia magnética puede aplicarse a gran número
de patologías), se tendrá que decidir cuál se va a evaluar. Para guiar esta decisión se deben tener en
cuenta los siguientes factores:
• Frecuencia de la enfermedad o estado. Se priorizarán aquellas aplicaciones que afecten a mayor
número de personas;
• Coste de la tecnología: las tecnologías más caras deben ser evaluadas con el máximo rigor para evitar
gastos innecesarios al sistema sanitario;
• Existencia de un criterio de referencia que permita la comparación;
• Impacto potencial sobre el manejo del paciente: se debe hacer mayor esfuerzo en mejorar la calidad de
las pruebas diagnóstica de las condiciones clínicas para las que hay tratamiento eficaz;
• Impacto potencial sobre el resultado clínico. Se dará prioridad a la evaluación de aquellas pruebas, que
en definitiva, contribuyan a la mejora del estado de salud de los pacientes;
• Existencia de métodos diagnósticos inadecuados para la situación clínica bajo estudio. Una vez
decidida la enfermedad o situación clínica que se va a estudiar, el diseño del estudio será similar al de
cualquier otro estudio observacional y los pacientes elegidos no deberán diferir substancialmente de
aquellos a los que posteriormente se aplicará la prueba. Se deben incluir, por tanto, pacientes con
diversos estadios clínicos de la enfermedad, ya que si se escogieran sólo los más graves, por ejemplo,
darían mayor número de positivos, aumentando de una forma ficticia la sensibilidad de la prueba.
La elección del criterio de referencia resulta, en ocasiones, muy compleja, bien por ser costoso o
potencialmente perjudicial para el individuo o porque simplemente no se ha desarrollado un mejor método
de diagnóstico. Sin embargo, utilizar un criterio de referencia de baja calidad puede conducir, a que la nueva
medida sea considerada falsamente de baja calidad. Por ejemplo, con un patrón áureo de baja sensibilidad
muchos resultados positivos de la nueva prueba serán considerados erróneamente falsos positivos,
disminuyendo el valor de la prueba.
9. Sesgos potenciales de los estudios sobre pruebas diagnósticas
modo de producción consecuencias modo de control
1. Sesgo de
selección
no se tiene en cuenta el
espectro clínico de la
enfermedad o comorbilidad
sobrestima Se y Es
si se representan los
casos graves;
infraestima Se y Es
si se representan los
casos leves
representar el espectro
completo en la muestra;
describir el espectro en el
análisis; análisis de la prueba
diagnóstica en los subgrupos
2. Sesgo de la
prueba de
referencia
imperfecta
no se dispone de una buena
prueba de referencia y se usa
la disponible (aunque no
clasifique bien y discrimine
correctamente sanos y
enfermos).
generalmente
sobrestima Se y Es
pero a veces los
infraestima
seguimiento clínicos de los
pacientes para conocer si son
enfermos o no; correcciones
matemáticas si se dispone de
un subconjunto de pacientes
con una adscripción definitiva
3. Sesgo de
incorporación
elementos de la prueba
diagnóstica forma parte de la
prueba de referencia
sobrestima Se y Es conceptualización adecuada de
la prueba diagnóstica y de la
prueba de referencia.
4. Sesgo de
revisión o
valoración
ciega
la interpretación de la prueba
diagnóstica y la prueba de
referencia se realiza
conociendo el otro resultado,
es decir, de modo no ciego
sobrestima Se y Es enmascaramiento de las
personas que interpretan (y
realizan) la prueba diagnóstica y
la prueba de referencia
5. Sesgo de
secuencia o
verificación
diagnóstica
el resultado de la prueba
diagnóstica condiciona la
realización de una prueba de
referencia
sobrestima Se e
infraestima Es
realización estándar en todos
los pacientes del estudio; si no
es posible hacerlo: seguimiento
de las pruebas negativas y
correcciones matemáticas
26
modo de producción consecuencias modo de control
6. Sesgo por
resultados no
interpretables
es una eventualidad que se
produce en cualquier prueba
diagnóstica o de referencia
sobrestima Se y Es repetición de la prueba si es
posible; Inclusión en el estudio
de los casos no interpretables
7. Sesgo por
variabilidad en
la
interpretación
de resultados
diversos observadores que
actúan dentro del estudio
tienen diferentes Se y Es ; el
mismo observador cambia su
Se y Es dentro del estudio
debido al entrenamiento
generalmente
infraestima Se y Es
estudios previos (piloto) de
consistencia inter e
intraobservadores; correcciones
matemáticas
10. Evaluación diagnóstica: jerarquización
Nivel 1: Prestaciones técnicas. Las pruebas cumplen los criterios de calidad aceptables
Nivel 2: Prestaciones diagnósticas. Los resultados de las pruebas diagnósticas permiten hacer diagnósticos
precisos, es decir permiten identificar enfermos y no enfermos (eficiencia, valor predictivo, sensibilidad,
especificidad, razón de verosimilitud, área bajo la curva ROC)
Nivel 3 Impacto diagnóstico. Los resultados modifican la confianza que se tiene en el diagnóstico y evitan
otros estudios
Nivel 4: Impacto terapéutico. Los resultados de las pruebas intervienen en las decisiones terapéuticas y en
que proporción
Nivel 5: Impacto de los resultados. Los resultados de las pruebas contribuyen a mejorar el estado de salud
de los pacientes
Nivel 6: Impacto en la salud pública. Análisis coste beneficio y coste eficacia desde el punto de vista de la
sociedad
Bibliografía
1. Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York: Marcel Dekker;
1987.
2. Bermejo Fraile B. Epidemiología clínica aplicada a la toma de decisiones en medicina. Departamento de
Salud. Gobierno de Navarra; 2001.
www.cfnavarra.es/salud/docencia.investigacion/textos/Monograf_1/Epidemiologia_clinica.pdf
3. Escrig-Sos J, Martínez-Ramos D, Miralles-Tena JM. Pruebas diagnósticas: nociones básicas para su
correcta interpretación y uso. Cir Esp 2006;79(5):267-273.
4. Grenier B. Décision médicale. Paris: MASSON; 1993.
5. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005;365(9469):1500-5.
6. Hayden SR, Brown MD. Likelihood ratio: A powerful tool for incorporating the results of a diagnostic test
into clinical decisionmaking. Ann Emerg Med. 1999;33(5):575-80.
7. Redondo Alvaro FL. La lógica en la interpretación de las pruebas diagnósticas. Madrid: Garsi; 1989.
www.epiredperu.net/epired/ppts/curso_estadistica-scsf/estadistica-scsf-14.pdf
www.vhebron.es/ac/preventiva/docencia/mastphoenix/t06_pru_diagnosticas_diapos_fx.pdf
www.fisterra.com/mbe/investiga/pruebas_diagnosticas/pruebas_diagnosticas2.pdf
http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/6-Ayuda%20Pruebas%20diagnósticas.pdf
www.uquebec.ca/reglog/chapitre9.htm
http://www.spieao.uhp-nancy.fr/~kohler/LectureArticle/
www.med.univ.montpl.fr/Enseignement/cycle_2/c-ac-2eCR.htm

Weitere ähnliche Inhalte

Was ist angesagt?

Medidas epidemiologicas
Medidas epidemiologicasMedidas epidemiologicas
Medidas epidemiologicasVesna Ivsic
 
Uso adecuado de la auscultación pulmonar
Uso adecuado de la auscultación pulmonarUso adecuado de la auscultación pulmonar
Uso adecuado de la auscultación pulmonarcsjesusmarin
 
Tipos de errores, riesgo relativo y odds ratio
Tipos de errores, riesgo relativo y odds ratioTipos de errores, riesgo relativo y odds ratio
Tipos de errores, riesgo relativo y odds ratioFela Berecochea
 
Incidencia y prevalencia
Incidencia y prevalenciaIncidencia y prevalencia
Incidencia y prevalenciapaulaolias97
 
Puntos dolorosos de la pared abdominal
Puntos dolorosos de la pared abdominalPuntos dolorosos de la pared abdominal
Puntos dolorosos de la pared abdominalAlexia pmp
 
Signos abdominales
Signos abdominalesSignos abdominales
Signos abdominalesCFUK 22
 
Endócrino motivo de consulta y examen físico
Endócrino motivo de consulta y examen físicoEndócrino motivo de consulta y examen físico
Endócrino motivo de consulta y examen físicoGise Estefania
 
Patrones radiológicos pulmonares
Patrones radiológicos pulmonaresPatrones radiológicos pulmonares
Patrones radiológicos pulmonaresNery Josué Perdomo
 
Radiología de tórax, síndromes pleuropulmonares
Radiología de tórax, síndromes pleuropulmonares Radiología de tórax, síndromes pleuropulmonares
Radiología de tórax, síndromes pleuropulmonares Yiniver Vázquez
 
Epidemiologia
Epidemiologia Epidemiologia
Epidemiologia rubenroa
 

Was ist angesagt? (20)

Medidas epidemiologicas
Medidas epidemiologicasMedidas epidemiologicas
Medidas epidemiologicas
 
Examen físico del tórax
Examen físico del tóraxExamen físico del tórax
Examen físico del tórax
 
Evaluación Pruebas de Diagnóstico
Evaluación Pruebas de DiagnósticoEvaluación Pruebas de Diagnóstico
Evaluación Pruebas de Diagnóstico
 
Uso adecuado de la auscultación pulmonar
Uso adecuado de la auscultación pulmonarUso adecuado de la auscultación pulmonar
Uso adecuado de la auscultación pulmonar
 
FOCOS DE AUSCULTACIÓN CARDÍACA
FOCOS DE AUSCULTACIÓN CARDÍACAFOCOS DE AUSCULTACIÓN CARDÍACA
FOCOS DE AUSCULTACIÓN CARDÍACA
 
Tipos de errores, riesgo relativo y odds ratio
Tipos de errores, riesgo relativo y odds ratioTipos de errores, riesgo relativo y odds ratio
Tipos de errores, riesgo relativo y odds ratio
 
Incidencia y prevalencia
Incidencia y prevalenciaIncidencia y prevalencia
Incidencia y prevalencia
 
Puntos dolorosos de la pared abdominal
Puntos dolorosos de la pared abdominalPuntos dolorosos de la pared abdominal
Puntos dolorosos de la pared abdominal
 
Adenomna
AdenomnaAdenomna
Adenomna
 
Signos abdominales
Signos abdominalesSignos abdominales
Signos abdominales
 
Estudios de cohortes y casos y controles
Estudios de cohortes y casos y controlesEstudios de cohortes y casos y controles
Estudios de cohortes y casos y controles
 
Endócrino motivo de consulta y examen físico
Endócrino motivo de consulta y examen físicoEndócrino motivo de consulta y examen físico
Endócrino motivo de consulta y examen físico
 
Patrones radiológicos pulmonares
Patrones radiológicos pulmonaresPatrones radiológicos pulmonares
Patrones radiológicos pulmonares
 
Sesgos
SesgosSesgos
Sesgos
 
Palpacion de torax
Palpacion de toraxPalpacion de torax
Palpacion de torax
 
Radiología de tórax, síndromes pleuropulmonares
Radiología de tórax, síndromes pleuropulmonares Radiología de tórax, síndromes pleuropulmonares
Radiología de tórax, síndromes pleuropulmonares
 
Proyecciones Radiologicas
Proyecciones RadiologicasProyecciones Radiologicas
Proyecciones Radiologicas
 
Epidemiologia
Epidemiologia Epidemiologia
Epidemiologia
 
EL SIGNO DE LA SILUETA
EL SIGNO DE LA SILUETAEL SIGNO DE LA SILUETA
EL SIGNO DE LA SILUETA
 
exploración de hígado
exploración de hígado exploración de hígado
exploración de hígado
 

Ähnlich wie Evaluacion pruebas diagnosticas_08_07 (1)

Clase enfermedad y diagnostico
Clase enfermedad y diagnosticoClase enfermedad y diagnostico
Clase enfermedad y diagnosticoBeluu G.
 
inportabcia -calculo- sensibilidad -y-especifidad
inportabcia -calculo- sensibilidad -y-especifidadinportabcia -calculo- sensibilidad -y-especifidad
inportabcia -calculo- sensibilidad -y-especifidadNANCYGUADALUPELOPEZP
 
Taller+pruebas+y+tamizaje
Taller+pruebas+y+tamizajeTaller+pruebas+y+tamizaje
Taller+pruebas+y+tamizajeNOHEMA
 
Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...
Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...
Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...dantemalca
 
gond standar en radiologia control de calidad.pptx
gond standar en radiologia control de calidad.pptxgond standar en radiologia control de calidad.pptx
gond standar en radiologia control de calidad.pptxSergioRamirezCastill1
 
Cap. semana 7_pruebas_diagnosticas
Cap. semana 7_pruebas_diagnosticasCap. semana 7_pruebas_diagnosticas
Cap. semana 7_pruebas_diagnosticasYume_angelic
 
Epidemiología clinica
Epidemiología clinicaEpidemiología clinica
Epidemiología clinicaMilerbis Peña
 
Programas de cribado caracteristicas y condiciones para su puesta en marcha
Programas de cribado caracteristicas y condiciones para su puesta en marchaProgramas de cribado caracteristicas y condiciones para su puesta en marcha
Programas de cribado caracteristicas y condiciones para su puesta en marchaRaul Ivan
 
Ficha familiar listo
Ficha familiar listoFicha familiar listo
Ficha familiar listoDaniela G.
 
Minimanual cto epidemiologia y estadistica
Minimanual cto   epidemiologia y estadisticaMinimanual cto   epidemiologia y estadistica
Minimanual cto epidemiologia y estadisticaMel Pagotto
 
Minimanual cto epidemiologia y estadistica
Minimanual cto   epidemiologia y estadisticaMinimanual cto   epidemiologia y estadistica
Minimanual cto epidemiologia y estadisticaMel Pagotto
 
Enfermedad y diagnóstico
Enfermedad y diagnósticoEnfermedad y diagnóstico
Enfermedad y diagnósticoYoy Rangel
 
CLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptx
CLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptxCLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptx
CLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptxJeffWillianRosasQuin
 
2. MBE -OK SEM 2[1].pdf
2. MBE -OK SEM 2[1].pdf2. MBE -OK SEM 2[1].pdf
2. MBE -OK SEM 2[1].pdfWilhelmSnchez
 
estudio-de-casos-y-controles.ppt
estudio-de-casos-y-controles.pptestudio-de-casos-y-controles.ppt
estudio-de-casos-y-controles.pptDeivyDIONICIOROSADO
 
Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?
Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?
Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?Antonio J Cartón, MD, PhD
 

Ähnlich wie Evaluacion pruebas diagnosticas_08_07 (1) (20)

Clase enfermedad y diagnostico
Clase enfermedad y diagnosticoClase enfermedad y diagnostico
Clase enfermedad y diagnostico
 
inportabcia -calculo- sensibilidad -y-especifidad
inportabcia -calculo- sensibilidad -y-especifidadinportabcia -calculo- sensibilidad -y-especifidad
inportabcia -calculo- sensibilidad -y-especifidad
 
1 INTRODUCCIÓN.pdf
1 INTRODUCCIÓN.pdf1 INTRODUCCIÓN.pdf
1 INTRODUCCIÓN.pdf
 
3. Estudio de un test.
3. Estudio de un test.3. Estudio de un test.
3. Estudio de un test.
 
Taller+pruebas+y+tamizaje
Taller+pruebas+y+tamizajeTaller+pruebas+y+tamizaje
Taller+pruebas+y+tamizaje
 
Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...
Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...
Mod ii. lectura 7. lectura crítica de artículos de pruebas diagnósticas ii. a...
 
gond standar en radiologia control de calidad.pptx
gond standar en radiologia control de calidad.pptxgond standar en radiologia control de calidad.pptx
gond standar en radiologia control de calidad.pptx
 
Cap. semana 7_pruebas_diagnosticas
Cap. semana 7_pruebas_diagnosticasCap. semana 7_pruebas_diagnosticas
Cap. semana 7_pruebas_diagnosticas
 
Epidemiología clinica
Epidemiología clinicaEpidemiología clinica
Epidemiología clinica
 
Programas de cribado caracteristicas y condiciones para su puesta en marcha
Programas de cribado caracteristicas y condiciones para su puesta en marchaProgramas de cribado caracteristicas y condiciones para su puesta en marcha
Programas de cribado caracteristicas y condiciones para su puesta en marcha
 
Ficha familiar listo
Ficha familiar listoFicha familiar listo
Ficha familiar listo
 
Minimanual cto epidemiologia y estadistica
Minimanual cto   epidemiologia y estadisticaMinimanual cto   epidemiologia y estadistica
Minimanual cto epidemiologia y estadistica
 
Minimanual cto epidemiologia y estadistica
Minimanual cto   epidemiologia y estadisticaMinimanual cto   epidemiologia y estadistica
Minimanual cto epidemiologia y estadistica
 
EXPOSICION S.I.pdf
EXPOSICION S.I.pdfEXPOSICION S.I.pdf
EXPOSICION S.I.pdf
 
Enfermedad y diagnóstico
Enfermedad y diagnósticoEnfermedad y diagnóstico
Enfermedad y diagnóstico
 
CLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptx
CLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptxCLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptx
CLASE 2 - INTRODUCCION A LA SEMIOLOGIA.pptx
 
2. MBE -OK SEM 2[1].pdf
2. MBE -OK SEM 2[1].pdf2. MBE -OK SEM 2[1].pdf
2. MBE -OK SEM 2[1].pdf
 
Análisis de artículo de tratamiento (ensayo clínico
Análisis de artículo de tratamiento (ensayo clínicoAnálisis de artículo de tratamiento (ensayo clínico
Análisis de artículo de tratamiento (ensayo clínico
 
estudio-de-casos-y-controles.ppt
estudio-de-casos-y-controles.pptestudio-de-casos-y-controles.ppt
estudio-de-casos-y-controles.ppt
 
Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?
Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?
Proceso diagnóstico: ¿La ecografía pulmonar sirve para diagnosticar neumonías?
 

Mehr von Javier Cuestas

Estudios críticos de la administración
Estudios críticos de la administraciónEstudios críticos de la administración
Estudios críticos de la administraciónJavier Cuestas
 
004 teoría crítica (laso)
004 teoría crítica (laso)004 teoría crítica (laso)
004 teoría crítica (laso)Javier Cuestas
 
002 génesis de la teoría crítica (jay, martin)
002 génesis de la teoría crítica (jay, martin)002 génesis de la teoría crítica (jay, martin)
002 génesis de la teoría crítica (jay, martin)Javier Cuestas
 
Diagnóstico estratégico
Diagnóstico estratégicoDiagnóstico estratégico
Diagnóstico estratégicoJavier Cuestas
 
Materia de Administración Estratégica Bimestre1
Materia de Administración Estratégica Bimestre1Materia de Administración Estratégica Bimestre1
Materia de Administración Estratégica Bimestre1Javier Cuestas
 
Peter senge -_la_quinta_disciplina
Peter senge -_la_quinta_disciplinaPeter senge -_la_quinta_disciplina
Peter senge -_la_quinta_disciplinaJavier Cuestas
 
Slide: El Podcast Educativo
Slide: El Podcast EducativoSlide: El Podcast Educativo
Slide: El Podcast EducativoJavier Cuestas
 
Slidecast: El Podcast Educativo
Slidecast: El Podcast EducativoSlidecast: El Podcast Educativo
Slidecast: El Podcast EducativoJavier Cuestas
 
Materia Administración Estratégica-Ingeniería Empresarial
Materia Administración Estratégica-Ingeniería EmpresarialMateria Administración Estratégica-Ingeniería Empresarial
Materia Administración Estratégica-Ingeniería EmpresarialJavier Cuestas
 

Mehr von Javier Cuestas (13)

Bienes comunes2
Bienes comunes2Bienes comunes2
Bienes comunes2
 
Poder y subjetividad
Poder y subjetividad Poder y subjetividad
Poder y subjetividad
 
Estudios críticos de la administración
Estudios críticos de la administraciónEstudios críticos de la administración
Estudios críticos de la administración
 
004 teoría crítica (laso)
004 teoría crítica (laso)004 teoría crítica (laso)
004 teoría crítica (laso)
 
002 génesis de la teoría crítica (jay, martin)
002 génesis de la teoría crítica (jay, martin)002 génesis de la teoría crítica (jay, martin)
002 génesis de la teoría crítica (jay, martin)
 
El estado
El estadoEl estado
El estado
 
Diagnóstico estratégico
Diagnóstico estratégicoDiagnóstico estratégico
Diagnóstico estratégico
 
Materia de Administración Estratégica Bimestre1
Materia de Administración Estratégica Bimestre1Materia de Administración Estratégica Bimestre1
Materia de Administración Estratégica Bimestre1
 
Peter senge -_la_quinta_disciplina
Peter senge -_la_quinta_disciplinaPeter senge -_la_quinta_disciplina
Peter senge -_la_quinta_disciplina
 
Slide: El Podcast Educativo
Slide: El Podcast EducativoSlide: El Podcast Educativo
Slide: El Podcast Educativo
 
Slidecast: El Podcast Educativo
Slidecast: El Podcast EducativoSlidecast: El Podcast Educativo
Slidecast: El Podcast Educativo
 
Materia Administración Estratégica-Ingeniería Empresarial
Materia Administración Estratégica-Ingeniería EmpresarialMateria Administración Estratégica-Ingeniería Empresarial
Materia Administración Estratégica-Ingeniería Empresarial
 
Matriz bcg
Matriz bcgMatriz bcg
Matriz bcg
 

Kürzlich hochgeladen

CLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptxCLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptxMairimCampos1
 
Taller Si te drogas te dañas, sesión de información escolar
Taller Si te drogas te dañas, sesión de información escolarTaller Si te drogas te dañas, sesión de información escolar
Taller Si te drogas te dañas, sesión de información escolarJuanCarlosRodrguezGa9
 
Cavidad oral y faríngea // Histologia de ross
Cavidad oral y faríngea // Histologia de rossCavidad oral y faríngea // Histologia de ross
Cavidad oral y faríngea // Histologia de rossarlethximenachacon
 
"La auto-regulación como concepto esencial para la seguridad de la praxis clí...
"La auto-regulación como concepto esencial para la seguridad de la praxis clí..."La auto-regulación como concepto esencial para la seguridad de la praxis clí...
"La auto-regulación como concepto esencial para la seguridad de la praxis clí...Badalona Serveis Assistencials
 
ABDOMEN AGUDO Quirúrgico, etiologia.pptx
ABDOMEN AGUDO Quirúrgico, etiologia.pptxABDOMEN AGUDO Quirúrgico, etiologia.pptx
ABDOMEN AGUDO Quirúrgico, etiologia.pptxNikolaiChoqueAlarcn
 
Analisis Evolución Dengue - MINSA Perú 2024
Analisis Evolución Dengue - MINSA Perú 2024Analisis Evolución Dengue - MINSA Perú 2024
Analisis Evolución Dengue - MINSA Perú 2024Miguel Yan Garcia
 
Perfil-Sensorial-2-Child. Versión actualizada
Perfil-Sensorial-2-Child.  Versión actualizadaPerfil-Sensorial-2-Child.  Versión actualizada
Perfil-Sensorial-2-Child. Versión actualizadaNadiaMocio
 
MTC Reinos mutante MADERA FUEGO TIERRA.pdf
MTC Reinos mutante MADERA FUEGO TIERRA.pdfMTC Reinos mutante MADERA FUEGO TIERRA.pdf
MTC Reinos mutante MADERA FUEGO TIERRA.pdfMelindaSayuri
 
Como se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdf
Como se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdfComo se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdf
Como se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdfKEVINYOICIAQUINOSORI
 
Anatomía de la Esclera y clasificación.
Anatomía de la Esclera y clasificación.Anatomía de la Esclera y clasificación.
Anatomía de la Esclera y clasificación.MaraBelnZamoraAguila
 
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...Juan Rodrigo Tuesta-Nole
 
MEP Cirugía General 1 - Estudios MyC.pdf
MEP Cirugía General  1 - Estudios MyC.pdfMEP Cirugía General  1 - Estudios MyC.pdf
MEP Cirugía General 1 - Estudios MyC.pdfgabrielfernandezcarr
 
Manuel para el his cancer essalud .pptx
Manuel para el his cancer essalud  .pptxManuel para el his cancer essalud  .pptx
Manuel para el his cancer essalud .pptxluciana824458
 
Tríptico sobre la salud, cuidados e higiene
Tríptico sobre la salud, cuidados e higieneTríptico sobre la salud, cuidados e higiene
Tríptico sobre la salud, cuidados e higieneCarlosreyesxool
 
Emergencia Neumológica: Crisis asmática.pptx
Emergencia Neumológica: Crisis asmática.pptxEmergencia Neumológica: Crisis asmática.pptx
Emergencia Neumológica: Crisis asmática.pptxMediNeumo
 
La salud y sus determinantes, mapa conceptual
La salud y sus determinantes, mapa conceptualLa salud y sus determinantes, mapa conceptual
La salud y sus determinantes, mapa conceptualABIGAILESTRELLA8
 
Instrumental Quirúrgico 2° ed - Renee Nemitz (2).pdf
Instrumental Quirúrgico 2° ed - Renee Nemitz (2).pdfInstrumental Quirúrgico 2° ed - Renee Nemitz (2).pdf
Instrumental Quirúrgico 2° ed - Renee Nemitz (2).pdfAnaSanchez18300
 
Avance Tarea-3-Cuidados-Basicos de enfermeria.pptx
Avance Tarea-3-Cuidados-Basicos de enfermeria.pptxAvance Tarea-3-Cuidados-Basicos de enfermeria.pptx
Avance Tarea-3-Cuidados-Basicos de enfermeria.pptxangelicacardales1
 
EJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptx
EJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptxEJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptx
EJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptxMaria969948
 
UNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docx
UNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docxUNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docx
UNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docxRosiChucasDiaz
 

Kürzlich hochgeladen (20)

CLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptxCLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
 
Taller Si te drogas te dañas, sesión de información escolar
Taller Si te drogas te dañas, sesión de información escolarTaller Si te drogas te dañas, sesión de información escolar
Taller Si te drogas te dañas, sesión de información escolar
 
Cavidad oral y faríngea // Histologia de ross
Cavidad oral y faríngea // Histologia de rossCavidad oral y faríngea // Histologia de ross
Cavidad oral y faríngea // Histologia de ross
 
"La auto-regulación como concepto esencial para la seguridad de la praxis clí...
"La auto-regulación como concepto esencial para la seguridad de la praxis clí..."La auto-regulación como concepto esencial para la seguridad de la praxis clí...
"La auto-regulación como concepto esencial para la seguridad de la praxis clí...
 
ABDOMEN AGUDO Quirúrgico, etiologia.pptx
ABDOMEN AGUDO Quirúrgico, etiologia.pptxABDOMEN AGUDO Quirúrgico, etiologia.pptx
ABDOMEN AGUDO Quirúrgico, etiologia.pptx
 
Analisis Evolución Dengue - MINSA Perú 2024
Analisis Evolución Dengue - MINSA Perú 2024Analisis Evolución Dengue - MINSA Perú 2024
Analisis Evolución Dengue - MINSA Perú 2024
 
Perfil-Sensorial-2-Child. Versión actualizada
Perfil-Sensorial-2-Child.  Versión actualizadaPerfil-Sensorial-2-Child.  Versión actualizada
Perfil-Sensorial-2-Child. Versión actualizada
 
MTC Reinos mutante MADERA FUEGO TIERRA.pdf
MTC Reinos mutante MADERA FUEGO TIERRA.pdfMTC Reinos mutante MADERA FUEGO TIERRA.pdf
MTC Reinos mutante MADERA FUEGO TIERRA.pdf
 
Como se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdf
Como se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdfComo se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdf
Como se produjo la Penicilina de forma massiva en la II Guerra Mundial.pdf
 
Anatomía de la Esclera y clasificación.
Anatomía de la Esclera y clasificación.Anatomía de la Esclera y clasificación.
Anatomía de la Esclera y clasificación.
 
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
 
MEP Cirugía General 1 - Estudios MyC.pdf
MEP Cirugía General  1 - Estudios MyC.pdfMEP Cirugía General  1 - Estudios MyC.pdf
MEP Cirugía General 1 - Estudios MyC.pdf
 
Manuel para el his cancer essalud .pptx
Manuel para el his cancer essalud  .pptxManuel para el his cancer essalud  .pptx
Manuel para el his cancer essalud .pptx
 
Tríptico sobre la salud, cuidados e higiene
Tríptico sobre la salud, cuidados e higieneTríptico sobre la salud, cuidados e higiene
Tríptico sobre la salud, cuidados e higiene
 
Emergencia Neumológica: Crisis asmática.pptx
Emergencia Neumológica: Crisis asmática.pptxEmergencia Neumológica: Crisis asmática.pptx
Emergencia Neumológica: Crisis asmática.pptx
 
La salud y sus determinantes, mapa conceptual
La salud y sus determinantes, mapa conceptualLa salud y sus determinantes, mapa conceptual
La salud y sus determinantes, mapa conceptual
 
Instrumental Quirúrgico 2° ed - Renee Nemitz (2).pdf
Instrumental Quirúrgico 2° ed - Renee Nemitz (2).pdfInstrumental Quirúrgico 2° ed - Renee Nemitz (2).pdf
Instrumental Quirúrgico 2° ed - Renee Nemitz (2).pdf
 
Avance Tarea-3-Cuidados-Basicos de enfermeria.pptx
Avance Tarea-3-Cuidados-Basicos de enfermeria.pptxAvance Tarea-3-Cuidados-Basicos de enfermeria.pptx
Avance Tarea-3-Cuidados-Basicos de enfermeria.pptx
 
EJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptx
EJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptxEJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptx
EJERCICIOS DE BUERGUER ALLEN FISIOTERAPIApptx
 
UNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docx
UNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docxUNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docx
UNIDAD DE APRENDIZAJE ABRIL Y MAYO 2024.docx
 

Evaluacion pruebas diagnosticas_08_07 (1)

  • 1. 1 EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS Notas Índice 1. INTRODUCCIÓN 1 2. CLASIFICACIÓN DE ENFERMEDADES POR DIAGNOSIS 1 3. CRITERIOS DE CALIDAD DE LAS PRUEBAS DIAGNÓSTICAS 2 4. TIPOS DE PRUEBAS 3 5. PATRÓN ÁUREO 3 5.1. Diseño de investigación para evaluar una prueba diagnóstica 3 6. PARÁMETROS DE VALORACIÓN DE LAS PRUEBAS DIAGNÓSTICAS 4 6.1. Sensibilidad 5 6.2. Especificidad 5 6.3. Valor predictivo positivo 6 6.4. Valor predictivo negativo 6 6.5. Razones de verosimilitud 7 6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad 8 6.7. Intervalos de confianza para los coeficientes de probabilidad 9 6.8. Variabilidad de las razones de verosimilitud 9 6.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de las pruebas diagnósticas 15 6.10. Falsos positivos frente a falsos negativos. Criterios 19 6.11. Odds ratio diagnóstica 19 6.12. Efectividad de una prueba 20 6.13. Eficiencia diagnóstica de una prueba 20 6.14. El índice de Youden (Y) 20 6.15. El efecto de concentración 21 6.16. Ganancia diagnóstica 22 7. COMENTARIOS 24 8. ETAPAS DE UN ESTUDIO DE EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS 25 9. SESGOS POTENCIALES DE LOS ESTUDIOS SOBRE PRUEBAS DIAGNÓSTICAS25 10. EVALUACIÓN DIAGNÓSTICA: JERARQUIZACIÓN 26 BIBLIOGRAFÍA 26 1. Introducción Se trata de estudiar aquellos procedimientos estadísticos que permiten evaluar la validez, es decir cuánto se aproxima una medida al valor real que pretende medir. Son procedimientos muy generales, pero aquí se van a tratar al hilo del problema de las pruebas diagnósticas (problema muy importante en la práctica y la investigación clínica): pruebas para determinar si un individuo tiene, o no, una cierta enfermedad (u otra característica). Hay que resaltar (y no siempre se hace) que si bien la validez de una prueba depende exclusivamente de la prueba, las estimaciones numéricas que se obtengan de la misma pueden depender de la prevalencia y de las características clínicas de los pacientes que se hayan estudiado. 2. Clasificación de enfermedades por diagnosis Debe tenerse muy en cuenta el tipo de enfermedad que se está analizando y el grado de avance de la misma en el paciente, porque de acuerdo a ello se deberá puntualizar en ciertos aspectos, más que en otros, como se explicará más adelante. Por ahora, basta con efectuar una primera clasificación de las enfermedades en tres tipos básicos de acuerdo al siguiente esquema:
  • 2. 2 Tipo I: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el diagnóstico es un falso negativo. Tipo II: Son todas aquellas enfermedades donde la peor equivocación que se puede cometer en el diagnóstico es un falso positivo. Tipo III: Son las restantes, donde no se puede clasificar claramente como una de las anteriores. Las enfermedades que se pueden clasificar como Tipo I son: • Una enfermedad que es curable si se detecta a tiempo; • Una enfermedad que es grave y no puede dejarse pasar inadvertida; • Los falsos positivos no traumatizan ni psicológicamente, ni económicamente al paciente, pero los diagnósticos falsos negativos sí lo hacen. Ejemplos: infarto de miocardio, enfermedades venéreas y otras enfermedades infecciosas curables, la fenilcetonuria, el feocromocitoma (curable en el 100% de los casos sí es detectado a tiempo), cáncer de mama o de útero, etc. En cambio, una enfermedad donde para el paciente, un diagnóstico falso positivo es más peligroso que un falso negativo, se considera como del Tipo II, como ser: • La enfermedad es grave, pero difícilmente curable o sin remisión; • Es muy importante para el paciente o para la población él saberse un verdadero negativo; • Los falsos positivos traumatizan seriamente al paciente, en cambio los falsos negativos no; • El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente; Ejemplos: estado terminal o sin remisión de la enfermedad, cáncer oculto, esclerosis en placas, tratamientos como radioterapia, quimioterapia, lobectomía, cirugía innecesaria, estadio IV de la sífilis cuando ya no tiene remedio, etc. Cuando la enfermedad no puede ser encasillada en ninguno de los dos casos anteriores, entonces se la considera como del Tipo III, como por ejemplo: lupus eritematoso, ciertas formas de leucemia o linfoma, diabetes, etc. En el caso del SIDA un falso positivo puede ser muy dañino para el paciente, pero un falso negativo sería muy peligroso para la sociedad y como ambos peligros son graves, lo mejor es clasificarla como del Tipo III desde un punto de vista ético. Notar que una misma enfermedad puede ser clasificada de maneras diferentes, de acuerdo al estado de avance que tiene en el paciente. Un cáncer que pueda ser curado si se detecta a tiempo es un claro caso de Tipo I, pero una vez que se produjo una metástasis en el paciente pasa a ser del Tipo II. Lo mismo ocurre con los diferentes estados de la sífilis, que se puede curar si es detectada a tiempo, pero se torna incurable cuando está muy avanzada. 3. Criterios de calidad de las pruebas diagnósticas Capacidad de la prueba para medir efectivamente lo que se quiere medir • Identificación de los enfermos/sujetos sanos • Enfermo ⇒ Test positivo • Sujeto sano ⇒ Test negativo • Test positivo ⇒ Enfermo • Test negativo ⇒ Sujeto sano Una prueba diagnóstica es considerada de buena calidad si es capaz de clasificar correctamente a los miembros de la población a la que se aplica, dando resultados positivos en las personas enfermas y negativos en las carentes de la enfermedad de estudio. Es un grave error asumir que el resultado de una prueba diagnóstica es una representación fiel de la situación real de salud de un individuo. Por el contrario, el médico que reconoce las imperfecciones de una prueba se preguntará: ¿a la vista de este resultado, qué grado de seguridad tengo acerca del estado de salud de este paciente? La importancia de una prueba diagnóstica desde el punto de vista de evaluación de tecnologías se basa en varios factores. Al evaluar una prueba diagnóstica, no obstante, no debe tenerse en cuenta la calidad de la prueba aisladamente, sino que se deben valorar también las acciones que se van a poner en práctica cuando el resultado sea anormal. Así, una prueba cuyo resultado no tenga influencia sobre el manejo del paciente ni sobre su estado de salud, tendrá poca importancia en salud pública, y su evaluación no será prioritaria.
  • 3. 3 Otros factores que se deben valorar son el precio de la prueba así como su inocuidad, ya que pueden existir métodos menos invasivos o más económicos para obtener una información suficiente para nuestros propósitos. La calidad de una prueba diagnóstica se mide en términos de validez y seguridad. La validez de una prueba es el grado en que mide lo que se supone debe medir y para determinarla se debe comparar con otra prueba de probada eficacia en la enfermedad de estudio o con el verdadero resultado en el caso de que pueda ser conocido. Estos términos de comparación se denominan patrón áureo, “gold standard” o criterio de referencia. La validez se mide a través de la sensibilidad y la especificidad de la prueba. La seguridad de una prueba es la capacidad para predecir la presencia o ausencia de enfermedad y se mide en términos de los valores predictivos, positivo y negativo. 4. Tipos de Pruebas • Pruebas con respuesta dicotómica (positivo, “+”; negativo, ”–“), por ejemplo, la prueba de embarazo; • Pruebas con respuesta policotómica, por ejemplo, estadios del cáncer; • Pruebas con respuesta cuantitativa, por ejemplo, glucosa/diabetes, troponina/IAM. En este caso se presenta el problema de establecer un punto de corte para dicotomizar la respuesta (“+” o “–“). 5. Patrón áureo Para identificar la enfermedad se requiere disponer de un diagnóstico de certeza, una prueba de referencia, lo que se conoce con el nombre de patrón áureo (patrón oro, “gold standard”), para poder ver con respecto a este patrón la validez de otras pruebas diagnósticas, su calidad, su capacidad para identificar una enfermedad o para seguir un tratamiento. Figura 1. Esquema de los estudios de evaluación de pruebas diagnósticas. (1) patrón áureo (gold standard) válido; (2) comparación independiente; (3) espectro de pacientes adecuado; (4) descripción completa de los métodos; (5) presentación correcta de los resultados; (6) repercusión sobre el manejo diagnóstico–terapéutico. 5.1. Diseño de investigación para evaluar una prueba diagnóstica El modelo apropiado es un diseño descriptivo, en el cual un grupo de participantes con características determinadas acorde a la prueba a probar es sometido a la prueba y concomitantemente al patrón áureo. + – – + Pr(PREPRUEBA) Pr(POSTPRUEBA) POBLACION PATRON DE REFERENCIA PACIENTE PRUEBA DIAGNOSTICA 3 2 4 1 5 6
  • 4. 4 Figura 2. De esta manera, al cabo del estudio se dispondrá de los datos necesarios para completar la tabla de contingencia, permitiendo calcular todos los indicadores presentados. Para minimizar los sesgos, se deben considerar algunas premisas claves, a saber: 1. Selección de la muestra: la muestra debe incluir participantes que representen todas las formas clínicas del daño buscado y respetando la proporción en que la misma se presenta en la práctica cotidiana. Aún pruebas de escasa capacidad detectan aceptablemente los casos graves al compararlas con los sin daño. El mayor problema se presenta al intentar detectar a los casos de gravedad moderada a leve. Por ello, la muestra debe obtenerse desde la presentación consecutiva de casos clínicos que reúnan las características que los haría pasibles de la indicación de la prueba. Entre ellos, habrá casos de todas las formas clínicas e incluso casos sin daño. 2. Comparación: la misma debe establecerse con un patrón de referencia apropiado y confiable. El patrón áureo debe reunir esas características y todos los participantes deben recibir las dos pruebas (la que se está investigando y el patrón áureo). Es frecuente observar que si se seleccionó un patrón áureo invasivo y/o costoso, éste se aplique solamente a los que arrojaron un resultado anormal de la prueba en análisis. Este proceder impide que se completen los datos de la tabla de contingencia, ya que no se dispondría de los necesarios para llenar los casilleros c ni d y, por lo tanto, se hace imposible calcular sensibilidad ni especificidad. A este error de procedimiento (o error sistemático o sesgo) se lo denomina error de verificación (“work-up bias”). 3. Interpretación de los resultados: La lectura del resultado de la prueba analizada debe ser realizada desconociendo el resultado del patrón áureo, para evitar el sesgo hacia una coincidencia espúrea. 6. Parámetros de valoración de las pruebas diagnósticas Imaginemos que queremos evaluar una técnica analítica para el diagnóstico de una enfermedad (infecciosa, por ejemplo). Mediante un procedimiento aleatorio seleccionamos 200 personas que son evaluadas desde el punto de vista clínico, diagnosticándose 33 personas como enfermas. Tras realizar la prueba en todos ellos el resultado es el siguiente: prueba positiva prueba negativa total pacientes enfermos 27 (VP) 6 (FN) 33 (TE) pacientes no enfemos 3 (FP) 164 (VN) 167 (TNE) total 30 (TP) 170 (TN) 200 (T) Tabla 1 Los 27 pacientes que, estando enfermos, dieron positiva la prueba diagnóstica se consideran verdaderos positivos (VP). Los seis pacientes enfermos que dieron negativa la prueba de laboratorio son considerados como falsos negativos (FN). Los tres pacientes no enfermos que dieron positiva la prueba se denominan falsos positivos (FP). Los 164 pacientes no enfermos que no dieron positivo en la prueba son los verdaderos negativos (VN). A continuación se procederá a definir los parámetros de valoración de las pruebas diagnósticas. Muestra (individuos consecutivos con las características establecidas) A todos se efectúa la prueba y el patrón áureo Enfermedad ausente, la prueba sugirió su presencia Enfermedad ausente, la prueba coincidió Enfermedad presente detectada por la prueba Enfermedad presente no detectada por la prueba
  • 5. 5 6.1. Sensibilidad Es el porcentaje de resultados positivos en pacientes con una determinada enfermedad. Mide el porcentaje de individuos enfermos correctamente diagnosticados La sensibilidad indica la capacidad de una prueba para detectar a un sujeto enfermo. La sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquel que realmente lo está. La sensibilidad expresa cuán "sensible" es la prueba a la presencia de la enfermedad. Una alta sensibilidad indica un bajo número de falsos negativos. La sensibilidad sería la probabilidad de que un paciente enfermo diese la prueba positiva o el porcentaje de positivos de la prueba en pacientes con la enfermedad, ( ) 100 % VP Sensibilidad TE × = En el ejemplo la sensibilidad ( ) Se será: 27 100 81,8% 33 Se × = = Una sensibilidad del 81,8 % indica que solo el 81,8 % de los pacientes enfermos darán positiva la prueba. En este caso habrá un 18,2 % de falsos negativos (pacientes enfermos que han dado negativa la prueba). Cuanto más sensible es una prueba, más probable es que detecte a las personas con enfermedad. Por ello, las pruebas con una sensibilidad muy elevada son muy útiles para descartar la presencia de enfermedad. 6.2. Especificidad Es el porcentaje de resultados negativos en pacientes que no padecen esa enfermedad. Valora la capacidad de una prueba para detectar correctamente individuos sanos. La especificidad es la probabilidad de que un individuo sano tenga un resultado negativo. Una alta especificidad indica una baja frecuencia de falsos positivos. La especificidad sería la probabilidad de que un paciente sano diese la prueba negativa o el porcentaje de negatividad de la prueba diagnóstica en ausencia de enfermedad, o: ( ) 100 % VN Especificidad TNE × = En el ejemplo la especificidad ( ) Es será: 164 100 98,2% 167 Es × = = Una especificidad del 98,2 % indica que el 98,2 % de los individuos sanos darán negativa la prueba. En este caso habrá un 1,8 % de falsos positivos (pacientes sanos que han dado positiva la prueba). Las pruebas muy específicas se usan para confirmar la presencia de una enfermedad. Si la prueba es muy específica y da positiva, indica la presencia de enfermedad, ya que apenas produce falsos positivos. Aunque la sensibilidad y la especificidad son dos índices de calidad de la prueba, en la práctica clínica las preguntas a las que interesa responder son: ¿cuál es la probabilidad de que esté verdaderamente enfermo si un sujeto ha resultado positivo, ( ) Pr | E T + + ? y, por el contrario, ¿cuál es la probabilidad de que realmente esté sano si el sujeto resultó negativo en la prueba, ( ) Pr | E T − − ? Estas dos probabilidades se pueden calcular aplicando el teorema de Bayes, siempre que se conozca la probabilidad de que el sujeto esté enfermo antes de realizar la prueba, o probabilidad preprueba. Si no se dispone de ninguna información adicional sobre el sujeto, dicha probabilidad será la prevalencia de la patología en la población, aplicable sólo en el caso de programas de cribado ("screening") sobre la población general, ya que en la práctica habitual los sujetos candidatos a una prueba diagnóstica lo son por las sospechas deducidas de la anamnesis o por una sintomatología previa, y por tanto la probabilidad de que padezcan la enfermedad bajo sospecha será superior a la prevalencia de ésta en la población general.
  • 6. 6 Denominando P a la probabilidad preprueba de padecer la enfermedad, Se a la sensibilidad de la prueba y Es a su especificidad, las siguientes fórmulas permiten calcular la probabilidad postprueba de que el sujeto esté enfermo cuando resultó positivo o de que esté sano cuando resultó negativo: ( ) ( )( ) ( ) ( ) ( ) Pr | 1 1 Pr | 1 1 Se P E T Se P Es P Es P E T Es P Se P × + + = × + − − × − − = − + − × donde la probabilidad condicional se representa de la forma habitual con el símbolo | Así ( ) Pr | E T + + significa: suceso E + (enfermo) condicionado a que haya ocurrido el suceso T + (resultado positivo en la prueba). Si se calculan estas probabilidades únicamente con los datos de la tabla, la primera de ellas, ( ) Pr | E T + + , a la proporción de sujetos que verdaderamente tienen la enfermedad, de entre los que dieron positivo, y se conoce como valor predictivo positivo, VPP: VP VPP VP FP = + Igualmente se puede calcular en la tabla la proporción de sujetos verdaderamente sanos sobre el total de los que dieron negativo, valor predictivo negativo, VPN: VN VPN VN FN = + 6.3. Valor predictivo positivo El valor predictivo positivo es el porcentaje de pacientes enfermos entre todos los pacientes con resultados positivos. Valora la probabilidad de que una prueba positiva diagnostique correctamente a un individuo enfermo. El valor predictivo positivo de una prueba sería la probabilidad de que una prueba positiva correspondiese a un verdadero enfermo o el porcentaje de pacientes enfermos con resultados positivos con respecto al total de resultados positivos, o: ( ) 100 % VP VPP TP × = En el ejemplo, el VPP será: 27 100 90% 30 VPP × = = Un VPP del 90 % indica que de cada 100 pacientes que dan la prueba positiva solo 90 padecen la enfermedad, o lo que es lo mismo: si la prueba da positiva, la probabilidad de padecer la enfermedad es de un 90 %. En este caso habrá un 10 % de individuos sanos diagnosticados incorrectamente como enfermos. Pero esto no significa que haya un 10 % de falsos positivos. 6.4. Valor predictivo negativo El valor predictivo negativo Indica la frecuencia de pacientes no enfermos entre todos los pacientes con resultado negativo. Valora la probabilidad de que una prueba negativa diagnostique correctamente a un individuo sano. El valor predictivo negativo de una prueba será la probabilidad de que una prueba negativa diagnosticase correctamente a un individuo sano o el porcentaje de individuos sanos con resultados negativos con relación al total de resultados negativos, o: ( ) 100 % VN VPN TN × = En el ejemplo, el VPN será:
  • 7. 7 164 100 96,5% 170 VPN × = = Un valor predictivo negativo del 96,5 % indica que de cada 100 pruebas negativas, 96,5 pertenecerán a individuos sanos, o lo que es igual, si la prueba da negativa, la probabilidad de no padecer la enfermedad es del 96.5 %. En este caso hay un 3,5 % de individuos enfermos que serán diagnosticados erróneamente como no enfermos. Esto tampoco significa que haya un 3,5 % de falsos negativos. El intervalo de confianza al 95 % de los valores predictivos se calculan de acuerdo con las siguientes expresiones: ( ) ( ) 1 1 VPP VPP VPP a b VPN VPN VPN c d ε ε − ± + − ± + donde 1,96 ε = Los valores predictivos dependen mucho de la prevalencia de la enfermedad en la población (cociente entre enfermos y población), no así la sensibilidad y la especificidad, que son independientes de la misma. Puesto que esos dos índices VPP y VPN son los que interesan en la práctica clínica, parecería natural utilizarlos como índices de comparación a la hora de evaluar dos métodos diagnósticos diferentes. Sin embargo presentan un grave inconveniente, ya que si se calculan a partir de la tabla dependen de la proporción de enfermos en la muestra estudiada. Por ello para una determinada prueba resulta necesario determinar unos índices de valoración que, respondiendo a las necesidades reales en cuanto a la clasificación de pacientes, sin embargo no dependan de esa proporción de enfermos en la muestra, tales como las razones de verosimilitud 6.5. Razones de verosimilitud Se puede calcular el cociente entre la tasa de verdaderos positivos y la tasa de falsos positivos: ( ) ( ) Pr | Pr | T E CP T NE + + = + Este cociente CP + se conoce como cociente de probabilidad positivo o también como cociente de verosimilitud de una prueba positiva (likelihood ratio of positive test, LR + o L + ), razón de verosimilitud de una prueba positiva ( ) RV + , razón de verosimilitud de inclusión, potencia (o poder) predictiva de una prueba positiva, o índice de eficiencia pronóstica ( ) IEP de un resultado positivo. Valores mayores de CP + indican mejor capacidad para diagnosticar la presencia de enfermedad. De la misma forma, podemos definir un cociente de probabilidad negativo CP − ( ) ( ) Pr | Pr | T E CP T NE − − = − Valores de CP − menores indican una mejor capacidad diagnóstica de la prueba (mejor capacidad para diagnosticar la ausencia de enfermedad). El cociente de probabilidad negativo también se conoce como cociente de verosimilitud negativo ( ) , LR λ − , razón de verosimilitud negativa ( ) RV − , razón de verosimilitud de exclusión, índice de eficiencia pronóstica de una prueba negativa. El inverso de este cociente se llama poder (o potencia) predictiva de una prueba negativa. Se puede determinar unas fórmulas para expresar los cocientes de probabilidad en función de la sensibilidad Se y de la especificidad Es :
  • 8. 8 1 1 Se CP Es Se CP Es + = − − − = La ventaja de los cocientes CP + y CP − frente a los valores predictivos positivo y negativo de la prueba radica en que, a diferencia de éstos, no dependen de la proporción de enfermos en la muestra, sino tan sólo de la sensibilidad y especificidad de ésta, de ahí su utilidad a la hora de comparar pruebas diagnósticas. Además si se conoce o se puede hacer una estimación de la probabilidad preprueba de que un sujeto padezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba se podrá "corregir" ese valor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye según que el resultado sea positivo o negativo, aplicando la siguiente fórmula ( ) Pr 1 1 post P CP P CP × = + − donde P es la probabilidad preprueba, CP el correspondiente cociente de probabilidad (positivo si deseamos calcular la probabilidad de que padezca la enfermedad, negativo en caso contrario) y Prpost es la probabilidad postprueba. Véase un ejemplo numérico de todo lo anterior: patología enfermo ( ) E + no enfermo ( ) E − positiva ( ) T + 72 100 positivos: 172 prueba negativa ( ) T − 18 150 negativos: 168 total enfermos: 90 no enfermos: 250 total: 340 Tabla 2 Aplicando las fórmulas anteriores se tiene: valor estimado intervalo de confianza al 95 % sensibilidad 0,80 0,72 – 0,88 especificidad 0,60 0,54 – 0,66 CP+ 2,00 1,66 – 2,40 CP– 0,33 0,22 – 0,51 Tabla 3 Evidentemente los valores de los diferentes índices son estimaciones realizadas mediante un experimento diseñado al efecto, por lo que es necesario calcular algún indicador de su grado de incertidumbre, como puede ser un intervalo de confianza del 95 %. 6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad ( ) ( ) ( ) ( ) 95% 95% 1 1,96 1 1,96 Se Se IC Se Se m Es Es IC Es Es n − = ± − = ± donde m es el número de enfermos; y
  • 9. 9 n es el número de no enfermos. Para un intervalo de confianza (IC) del 99 % hay que reemplazar 1,96 por 2,576 y para un IC del 99,9% hay que reemplazar 1,96 por 3,290 6.7. Intervalos de confianza para los coeficientes de probabilidad ¿Cuán fiables son los coeficientes de probabilidad ( ) CP calculados sobre muestras? Se necesita calcular su intervalo de confianza que no es fácil para cocientes de probabilidades. Hay varios métodos aproximados para muestras grandes. 6.7.1. Si el CP es próximo a 1: método de Miettinen 2 2 z CP α χ ± donde 2 χ es el estadístico de asociación de la tabla 2 x 2. Por ejemplo, para 2 0,2 χ = , el intervalo de confianza al 95 % es ( ) 1,96 0,2 1,02 0,92 , 1,09 ± = 6.7.2. Si el CP no es próximo a 1: aproximación de primer orden del desarrollo de Taylor [ ]( ) ( ) [ ]( ) ( ) 2 2 1 ln 1 ln 1 % 1 % Se Es CP z d c Se Es CP z b a IC CP e IC CP e α α α α − + ± + − − ± + + − = − − = Si se comparan dos pruebas diagnósticas A y B , se calculan sus cocientes de probabilidad positivos, y se observa que A B CP CP + > + , se podrá afirmar que la prueba A es mejor que la B para confirmar la presencia de enfermedad. Si en cuanto a los cocientes de probabilidad negativos se observa que A B CP CP −< − se podrá afirmar que la prueba A es mejor que la B para confirmar la ausencia de enfermedad. 6.8. Variabilidad de las razones de verosimilitud La incidencia de las razones de verosimilitud sobre los valores predictivos y sobre la utilización diagnóstica de los signos y de las pruebas es tal que resulta útil analizar aunque sea brevemente, el respectivo papel de sus dos componentes, sensibilidad y especificidad. Si la especificidad es constante, las razones de verosimilitud positivas 1 Se L Es = − son función lineal de la sensibilidad. Cuando la sensibilidad aumenta, L aumenta en la misma proporción. La razón de verosimilitud negativa 1 Es Se λ − = es igualmente una función lineal de la sensibilidad, pero negativa: cuando aumenta la sensibilidad, λ disminuye en la misma proporción (Figura 3)
  • 10. 10 Figura 3. Variación de la razón de verosimilitud en función de la sensibilidad para diferentes pruebas cuya especificidad es igual a 0,90. Cuando 1 0,1 Se Es = − = , las dos razones de verosimilitud son iguales a 1 la prueba no tiene ningún valor diagnóstico. El valor diagnóstico del resultado –positivo o negativo– de la prueba crece linealmente cuando la sensibilidad aumenta de 0,10 a 1,00. Figura 4. Variación de las razones de verosimilitud en función de la especificidad para diferentes pruebas cuya sensibilidad es igual a 0.80
  • 11. 11 Cuando 1 0,8 Es Se = − = , las dos razones de verosimilitud son iguales a 1 y por lo tanto en esta situación la prueba carece de utilidad diagnóstica. Se nota que la progresión de L es muy rápida cuando la especificidad es superior a 0,7. La razón de verosimilitud negativa se modifica poco cuando Es crece de 0,50 a 1,00, mientras que la razón de verosimilitud positiva L se afectada mucho por variaciones mínimas de la especificidad cuando ésta es muy elevada; así, cuando Es crece de 0,90 a 0,95, L pasa de 8 a 16. Si la sensibilidad es constante, las dos razones de verosimilitud son funciones hiperbólicas de la especificidad. La razón de verosimilitud positiva L , en particular, crece muy rápidamente y tiende hacia el infinito cuando la especificidad de una prueba –o de un grupo de pruebas– tiende hacia 1. Se dice que la eficacia diagnóstica de una prueba, en la investigación de una enfermedad determinada E , está estrechamente ligada al crecimiento de su especificidad, cualidad que, precisamente, es estable en el caso de los sujetos no afectados por la enfermedad E Comparando los cocientes de probabilidad de dos pruebas diagnósticas existen cuatro posibles resultados que podemos reflejar en una gráfica. En el eje de las Y representamos la sensibilidad, en el eje de las X se representa (1−especificidad). El punto representa los valores de sensibilidad y (1−especificidad) observados para la prueba A . Se traza una línea desde el origen (0,0) que pase por el punto A y otra desde el valor (1,1) que también pase por ese punto, quedando dividido el gráfico en cuatro zonas como se ve en la Figura 5, de tal manera que cualquier otra prueba cuyo resultado representemos en esa gráfica estará en alguna de las cuatro zonas Figura 5. Las zonas corresponden a las siguientes situaciones: 1: en esta región la prueba B es siempre superior a la A, tanto para confirmar presencia como ausencia de enfermedad; 2: aquí la prueba B sólo es superior a la A para confirmar ausencia de enfermedad; 3: en esta zona B siempre es inferior a A; 4: si el resultado de B está en este área, será superior a A para confirmar la presencia de enfermedad. Supóngase ahora que se desea comparar la prueba A con otra prueba B cuya sensibilidad es 0,9 y especificidad 0,5. Representándolo en la Figura 6 se obtiene:
  • 12. 12 Figura 6. B cae en la zona 2 por lo que es una prueba mejor que A para confirmar la ausencia de enfermedad, como se puede determinar también numéricamente al calcular los correspondientes cocientes de probabilidad CP+ = 1,8 y CP− = 0,2. Todas estas consideraciones se refieren únicamente a la capacidad discriminatoria de una prueba. La decisión sobre qué prueba diagnóstica es más adecuada, siempre es algo más complicada, puesto que intervienen otros aspectos, como son el coste de la prueba, los riesgos que supone para el paciente, valorar las consecuencias que conlleva un falso positivo o un falso negativo... Evidentemente para comparar los parámetros de dos pruebas diagnósticas habrá que considerar que los valores obtenidos sólo son estimaciones y están sometidos por tanto a posibles errores de muestreo, por lo que habrá que efectuar el correspondiente contraste estadístico para determinar si las diferencias encontradas son suficientemente importantes como para no poder ser atribuidas al azar. Si la razón de verosimilitud es igual a 1, la probabilidad del diagnóstico es la misma antes y después de aplicar la prueba. En este caso la prueba es inútil, no tiene capacidad discriminante. Cuanto más se aleje de 1 el valor de la razón de verosimilitud, mas interés presenta la prueba. 10 0,1 CP ó CP + > −< Generan cambios amplios y a menudo concluyentes desde una probabilidad preprueba hasta una probabilidad postprueba 5 10 0,1 0,2 CP y CP < +< < −< Generan cambios moderados desde la probabilidad preprueba hasta la probabilidad postprueba 2 5 0,05 0,2 CP y CP < +< < −< Generan cambios pequeños (pero en ocasiones importantes) de la probabilidad 1 2 0,5 1 CP y CP < +< < −< Alteran la probabilidad en un grado insignificante (y rara vez importante). Tabla 4. Interpretación de los cocientes de probabilidad (según el Evidence-based Medicine Working Group) Ventajas de la razón de verosimilitud • Es independiente de la prevalencia; • Es un buen reflejo del valor de la prueba cualquiera que sea el grupo al que se aplique; • Resumen la información en sólo parámetro;
  • 13. 13 • Utilizable para diferentes niveles de resultados de una prueba. Para cada nivel procura una información diferente permitiendo interpretar mejor los resultados de la prueba; • Permite calcular de manera individual el interés de realizar la prueba a partir de la probabilidad inicial de la enfermedad del paciente. Los cocientes de probabilidad permiten transformar la probabilidad preprueba en probabilidad postprueba mediante la relación: post R pre odds CP odds = × Recuérdese que se denomina oddsi al cociente entre la probabilidad de que un evento (en este caso “estar enfermo”) ocurra y la probabilidad de que no ocurra, por lo tanto: 1 1 p odds odds p p odds = ⇒ = − + los subíndices post y pre indican postprueba y preprueba respectivamente y el subíndice R representa el resultado obtenido. En el caso del siguiente ejemplo: ecocardiograma péptido natriurético tipo B (pmol/L) normal ( <18,7) elevado (≥ 18,7) total normal a 93 b 50 r = a + b 143 disfunción c 1 d 11 s = c + d 12 total t = a + c 94 u = b + d 61 N = a + b + c + d 155 Tabla 5. Resultados de la evaluación del péptido natriurético tipo B 1 1 d Se d r s CP b Es b s r c Se c r s CP a Es a s r × + = = = − × − × − = = = × Los CP de la prueba del ejemplo son 11 143 2,62 50 12 1 143 0,13 93 12 d r CP b s c r CP a s × × + = = = × × × × − = = = × × supóngase que se le aplica la prueba a un anciano al que por su sintomatología e historia se le estima una probabilidad alta (por ejemplo, 0,7) de padecer disfunción ventricular izquierda ¿cómo se modificaría esta probabilidad si se le midiera la concentración plasmática del péptido y resultara positiva ( ≥ 18,7)? A partir de la probabilidad preprueba, primero se calcula el 0,7 2,33 1 0,7 pre odds = = − ; como el resultado es positivo 2,62 CPR CP = + = , por tanto 2,62 2,33 6,10 post odds = × = y ( ) 6,10 Pr 0,86 7,10 post = = ; si el resultado de la prueba hubiera sido negativo 0,13 CPR CP = −= y 0,13 2,33 0,30 post odds = × = y por lo tanto ( ) 0,30 Pr 0,23 1,30 post = = .
  • 14. 14 Figura 7. Nomograma de Fagan (Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975; 293(5): 257) Fagan (1975) describió un nomograma para el teorema de Bayes, basado en la capacidad de convertir el teorema de Bayes en una función sumatoria lineal simple. Con un par de trucos matemáticos se puede conseguir esto. Primero, se necesita la versión de probabilidad del teorema de Bayes: " " " " Odds postprueba Odds preprueba CP = × o de forma simbólica: ( ) Pr Pr R E E O O E R R E         =           Donde E representa enfermedad; E representa ausencia de enfermedad; y R es un resultado específico de la prueba. Tomando logaritmos, se convierte en una simple suma: ( ) ( ) ( ) log " " log " " log Odds postprueba Odds preprueba CP = + o de forma simbólica: ( ) ( ) Pr log log log Pr R E E O O E R R E                 = +                     o también: ( ) ( ) ( ) ( ) ( ) ( ) ( ) Pr Pr log Pr log Pr log postprueba preprueba x CP postprueba preprueba CP = = +
  • 15. 15 El nomograma tiene tres columnas: la primera es la probabilidad de tener la enfermedad antes de aplicar la prueba (prevalencia), la segunda es la razón de verosimilitud ( ) CP y la tercera la probabilidad postprueba ( ) , PPP VPP . Con una regla se traza una línea entre la probabilidad preprueba y la razón de verosimilitud. La prolongación de esta línea corta en la tercera columna la probabilidad de tener la enfermedad en función del resultado de la prueba, Figura 8. Nomograma de Fagan. Para una prevalencia de 34 % se observa como mejora la probabilidad postprueba de las variables estudiadas 6.9. Valores predictivos y razones de verosimilitud. Interés en la evaluación de las pruebas diagnósticas ( ) ( )( ) ( ) ( ) Pr | 1 1 1 1 1 1 1 P Se M S VPP P Se P Es P L VPP P L P VPN P λ × = = × + − − × = × − + − = × − + P VPP VPN 1–VPN 1,0 1,0 0,00 1,0 0,95 0,98 0,095 0,905 0,90 0,96 0,18 0,82 0,80 0,92 0,33 0,67 0,70 0,87 0,46 0,54 0,666 0,86 0,50 0,50 0,60 0,82 0,57 0,43 0,50 0,75 0,666 0,33 0,45 0,71 0,71 0,29 0,40 0,67 0,75 0,25 0,30 0,56 0,82 0,18
  • 16. 16 P VPP VPN 1–VPN 0,25 0,50 0,86 0,14 0,20 0,43 0,89 0,11 0,10 0,25 0,95 0,05 0,05 0,14 0,97 0,03 0,01 0,03 0,99 0,01 0,00 0,00 1,00 0,00 Tabla 5. Variación de los valores predictivos de una misma prueba ( ) 3 0,50 L y λ = = cuando P varía de 1 a 0. ( ) 1 VPN − es la probabilidad de sufrir una enfermedad en presencia de una prueba negativa. Figura 9. Variación de los valores predictivos de una prueba cuyas cualidades son ( ) 3 0,50 L y λ = = , cuando la probabilidad preprueba de la enfermedad varía entre 0 y 1 Las curvas de los valores predictivos en función de la probabilidad a priori P son hipérbolas. Los puntos destacables de estas tres curvas son: • A donde el valor predictivo positivo es igual a 0,50; • B donde el valor predictivo negativo es igual a 0,50; • C donde VPP VPN = , cuando 1 1 P Lλ = + Para una misma prueba, cuando P disminuye, VPP disminuye y VPN aumenta. Cuando P aumenta, VPP aumenta y VPN disminuye. Se nota que el valor predictivo positivo al principio crece rápidamente cuando la probabilidad preprueba crece entre 0 y 0,50 y después más lentamente. El VPP es inferior a 0,50 cuando la probabilidad a priori o preprueba es inferior a 1 1 1 P L = + , en el ejemplo, donde 3 L= , cuando P es inferior a 1 0,25 1 3 = + (Figura 8).
  • 17. 17 Cuando la probabilidad preprueba de la enfermedad E es inferior a 1 1 L + , el VPP o probabilidad postprueba de la enfermedad es inferior al 50 %, incluso si la prueba da un resultado positivo. El VPN disminuye cuando crece la probabilidad preprueba de la enfermedad. Es inferior a 0,50 cuando P es inferior a 2 1 1 P λ = + , en el ejemplo 2 1 0,666 1 0,50 P = = + (Figura 8). Así, cuando la probabilidad primaria es superior a 2 1 1 P λ = + incluso si la prueba da un resultado negativo, la probabilidad a posteriori o postprueba de la enfermedad es superior al 50 %. Los dos valores 1 P y 2 P de la probabilidad primaria, tales que: 1 2 1 1 1 1 P L P λ = + = + determinan lo que se puede definir como el intervalo de seguridad de la prueba. En efecto, cuando la probabilidad primaria se sitúa dentro de este intervalo, un resultado positivo de la prueba da un VPP superior al 50 % y un resultado negativo da una probabilidad secundaria de la enfermedad inferior al 50 %. Este no es el caso cuando P se sitúa fuera de este intervalo: si P es inferior a 1 P , la probabilidad postprueba de la enfermedades inferior a 1 cambio sobre dos, incluso si la prueba da un resultado positivo. Cuando P es superior a 2 P , incluso si el resultado de la prueba es negativo, la probabilidad postprueba de la enfermedad es todavía superior a 1 cambio sobre 2 ( ) 0,50 > . Estas consecuencias matemáticas del intervalo de seguridad de la probabilidad primaria, tal como está definido por los límites 1 P y 2 P , son de una importancia capital para la conducta del razonamiento y de la decisión diagnóstica. Intervalo de seguridad diagnóstica Figura 10. Comparación de las curvas VPP y VPN de las pruebas “1” y “2” en función de las variaciones de la probabilidad primaria. Las cualidades diagnósticas respectivas de las dos pruebas son: para la prueba “1”: 18; 0,105 L λ = = ; Para la prueba “2”: 3; 0,50 L λ = = . Se observa que el intervalo de seguridad diagnóstica para la prueba “1” es mas estrecho que para la prueba “2”.
  • 18. 18 La curva del valor predictivo positivo VPP es tanto mayor cuanto más elevada es L , y la curva del valor predictivo negativo VPN es tanto menor cuanto más pequeña es λ . El Intervalo de seguridad diagnóstica es tanto más amplio cuanto más elevada es L y más pequeña λ . Figura 11. Variaciones de la probabilidad postprueba de la enfermedad E en función de la probabilidad preprueba P y de las cualidades diagnósticas de la prueba (Sox H.C. Ann Inter Med 1986;104:60-6). La Figura 11A representa tres pruebas cuya sensibilidad es idéntica, 0,90, y cuyas especificidades son crecientes, 0,80 para la prueba 1, 0,90 para la prueba 2 y 0,98 para la prueba 3. En la Figura 11B, las tres pruebas tienen una especificidad idéntica igual a 0,90, y las sensibilidades son respectivamente 0,60 para la prueba 1, 0,80 para la prueba 2 y 0,95 para la prueba 3. En la figura 11A, las tres pruebas tienen una sensibilidad idéntica, igual a 090 y una especificidad creciente, con las cualidades respectivas siguientes: sensibilidad especificidad L λ prueba 1 0,90 0,80 4,5 0,125 prueba 2 0,90 0,90 9,0 0,110 prueba 3 0,90 0,98 45,0 0,100 Tabla 6 La figura 11A muestra que para valores bajos de la probabilidad preprueba P , la eficacia diagnóstica del resultado positivo de la prueba –medida por el VPP – es tanto mas grande cuanto mas elevados son la especificada y la razón de verosimilitud positiva. En contra, las variaciones de la especificidad modifican muy poco la consecuencia del resultado negativo: en este caso el efecto de la probabilidad primaria es predominante. Las conclusiones inversas resultan de la figura 11B donde las tres pruebas tienen una especificidad idéntica igual a 0,90 y una sensibilidad creciente: sensibilidad especificidad L λ prueba 1 0,60 0,90 6,0 0,44 prueba 2 0,80 0,90 8,0 0,22 prueba 3 0,95 0,90 9,5 0,055 Tabla 7 Las variaciones de la sensibilidad afectan poco los valores predictivos positivos; en cambio, modifican considerablemente el efecto de un resultado negativo de la prueba, sobre todo cuando la probabilidad preprueba de la enfermedad es superior a 0,50 ó 0,60. En suma, cuando la probabilidad preprueba P es baja, un resultado negativo de la prueba tiene poca incidencia sobre la decisión diagnóstica; el de un resultado positivo de una prueba específica es elevado. Lo
  • 19. 19 inverso ocurre cuando la probabilidad preprueba es elevada: la consecuencias diagnósticas de un resultado negativo de una prueba sensible es considerable, el de un resultado positivo es débil. En una situación diagnóstica dada, la elección de una prueba por el clínico está guiada pues por la probabilidad preprueba de la enfermedad: si el diagnóstico es casi cierto, su confirmación por una prueba específica modifica muy poco su probabilidad; en cambio, el resultado negativo de una prueba sensible impondría una revisión seria de la toma de decisiones. Para optimizar la toma de decisiones, el clínico debe pues elegir una prueba cuya sensibilidad y especificidad sean apropiadas a la probabilidad preprueba de la enfermedad. La incidencia del resultado de la prueba sobre el proceso decisional traduce la eficacia diagnóstica de la prueba. Esta eficacia está medida sobre el efecto de concentración y por la noción de ganancia diagnóstica. Hasta ahora se ha estudiado el caso de un resultado dicotómico, pero en muchas ocasiones las pruebas diagnósticas son cuantitativas, sobre todo cuando corresponden a determinaciones analíticas. Evidentemente, se pueden utilizar todas las consideraciones hechas hasta el momento si se fija un punto de corte, un valor determinado de la prueba, que marque el límite entre “sano” y “enfermo”. Pero eso no suele ser una tarea sencilla. Se puede reflejar esquemáticamente en la figura 12: Figura 12 Existe una zona de posibles resultados de la prueba para la que la distribución de sujetos sanos y enfermos se solapan. Si se desea aumentar la probabilidad de detectar pacientes enfermos (en la Figura 12 corresponde a mover el punto de corte hacia la izquierda) se ve como también aumentan el número de falsos positivos. Si se desplaza el punto de corte hacia la derecha, disminuirán los falsos positivos, pero a costa de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la especificidad, y viceversa. 6.10. Falsos positivos frente a falsos negativos. Criterios 1. Gravedad o importancia en salud pública. Si el evento puede ser tratado y detectado evitando complicaciones posteriores han de utilizarse pruebas que minimicen el número de falsos negativos, es decir, se elegirán pruebas con alta sensibilidad; 2. Coste de las distintas pruebas, exámenes y cuidados médicos y de enfermería requeridos. Si el coste de todos ellos es alto han de minimizarse el número de falsos positivos, eligiendo pruebas con alta especificidad; 3. Consecuencias psicosociales. Si la enfermedad diagnosticada conlleva consecuencias al creer que uno está enfermo por ejemplo en el caso de VIH+ han de minimizarse los falsos positivos, eligiendo pruebas de alta especificidad; 4. Prevalencia de la enfermedad. Si es baja se ha de maximizar la especificidad para que aumente la eficiencia del programa. 6.11. Odds ratio diagnóstica La odds ratio diagnóstica (DOR) es conocida como un índice estadístico en los estudios epidemiológicos casos/controles representando la fuerza de asociación entre el factor de riesgo y la enfermedad. Aquí podría
  • 20. 20 ser útil para mostrar la fuerza de asociación entre el resultado de una prueba y la enfermedad. Este índice traduce las prestaciones de una prueba con un solo valor que no está influenciado por la prevalencia. Es la razón entre la odds de estar enfermo si la prueba da positivo y la odds de no estar enfermo si la prueba da negativo. ( ) ( ) 1 1 VPP VP VPP CP FN DOR FP VPN CP VN VPN − + = = = − − Los valores de la DOR varían de cero a infinito (cuantos más altos son los valores, mejor es la prueba). El valor 1 DOR = significa que la prueba no es discriminante, es la prueba inútil. Los valores mayores de 1 significan que es más probable que la prueba de positivo en el caso de enfermos que en sanos. 6.12. Efectividad de una prueba La efectividad de la prueba, cuya distribución es aproximadamente normal, se define como 3 3 ln ln ln 1 1 Se Es CP Se Es CP δ π π   + = + =   − − −   y que puede interpretarse como la diferencia entre las medias de los resultados entre una población de enfermos y otra de sanos en una escala normalizada. Si 1 δ = la prueba no es efectiva y si 3 δ = es altamente efectiva. 6.13. Eficiencia diagnóstica de una prueba Es el porcentaje de pacientes correctamente clasificados, o la probabilidad de que esa prueba diagnóstica acierte en sus conclusiones: VP VN Eficiencia VP VN FP FN + = + + + Si se tiene en cuenta la prevalencia, la expresión sería: ( ) ( ) ( ) Pr 1 Pr M Se Eficiencia M Es × = − × En el caso de que la prevalencia de la enfermedad sea 0,50, sería 0,5 0,5 Eficiencia Se Es = × + × y entonces se llamaría eficiencia estándar: 2 Se Es Eficiencia estándard + = que también se conoce como valor predictivo global y exactitud diagnóstica 6.14. El índice de Youden (Y) Este índice clínico fue propuesto por Youden (1950) para analizar la capacidad del método de diagnóstico, usando un único valor en reemplazo de la forma dual de hacerlo (sensibilidad y especificidad). La idea es mezclar los dos índices anteriores para hacer el estudio de calidad. Se define como: 1 Y Se Es = + − Varía de (–1) a (+1). Si es inferior o igual a 0, la prueba no tiene ningún valor informativo. La prueba es tanto de mejor cuanto el índice de Youden se acerca a 1. Hay una relación lineal entre este índice y la eficiencia estándar, ya que: ( ) 2 1 2 Se Es Y + = −
  • 21. 21 6.15. El efecto de concentración Se llama “efecto de concentración” al aumenta de la densidad –o de la probabilidad– investigada que es aportada por el resultado positivo de la prueba. El efecto de la concentración se traduce por la relación: ( ) ( ) Pr | Pr M T Probabilidad postprueba de M VPP Probabilidad preprueba de M M P + = = El efecto de concentración es precioso en situación de cribado de una enfermedad cuya prevalencia es muy baja en la población estudiada. Por ejemplo, como el feocromocitoma puede ser una causa, rara, de hipertensión arterial, su investigación sistemática se aconseja a causa de las posibilidades terapéuticas que aporta la ablación quirúrgica del tumor. Las pruebas diagnósticas propuestas son la medida de la eliminación urinaria de los derivados metoxilados de las catecolaminas. Las cualidades diagnósticas de la prueba en caso de los pacientes hipertensos son sensibilidad = 0,97; especificidad = 0,95 y razón de verosimilitud positiva = 19,4. Si esta costosa prueba se aplica al conjunto de los sujetos hipertensos donde la prevalencia del feocromocitoma es 0,004 P = , la probabilidad de una causa tumoral cuando la prueba es positiva no rebasa 0,07: por un solo paciente realmente portador de un tumor, la prueba da pues 13 resultados falsamente positivos. PF Plouin et al. (1981) han aconsejado aplicar esta prueba bioquímica sólo a los hipertensos que presenten la siguiente tríada sintomática: cefaleas, palpitaciones y crisis de sudoración. Las cualidades diagnósticas de la tríada han sido obtenidas sobre una muestra de 2585 sujetos hipertensos. feocromocitoma presente ausente presente 10 160 170 tríada ausente 1 2414 2415 11 2574 2585 Tabla 8 La presencia de la triada sintomática en el caso de un sujeto hipertenso aumenta la probabilidad del feocromocitoma a 10 0,06 170 = . La presencia de la triada sintomática tiene pues un “efecto de concentración” de la probabilidad del feocromocitoma en el caso de tales hipertensos, igual a: 0,06 14,7 0,004 VPP veces P = = Cuando la prueba bioquímica se aplica entonces a los pacientes seleccionados por este criterio clínico (en la hipótesis de que se mantengan en este grupo las cualidades diagnósticas establecidas en el conjunto de los hipertensos) su valor predictivo positivo sería entonces: ( ) 0,06 19,4 0,55 0,06 18,4 1 VPP × = = × + La prueba esta vez es perfectamente aceptable: por cada enfermo diagnosticado, no da mas que un resultado falsamente positivo, gracias al efecto de concentración provocado por el criterio clínico inicial. El efecto de concentración obtenido por el conjunto de esta “estrategia secuencial” es igual a 0,55 137,5 0,004 veces = . La ausencia de la triada sintomática reduce la probabilidad de feocromocitoma a 1 0,0004 2415 = , es decir a un nivel 10 veces mas bajo que en el conjunto de los hipertensos.
  • 22. 22 6.16. Ganancia diagnóstica Se llama ganancia diagnóstica a la diferencia entre la probabilidad preprueba de la enfermedad y la probabilidad postprueba obtenida por el resultado de la prueba. Si el resultado de la prueba es positivo, la ganancia diagnóstica ( ) G + se mide por la diferencia ( ) ( ) ( ) Pr | Pr G E T E VPP P + = + + − + = − Si el resultado de la prueba es negativo, la reducción de la probabilidad de la enfermedad se mide en valor absoluto por la diferencia ( ) ( ) ( ) ( ) Pr Pr | 1 G E E T P VPN − = + − + − = − − El conjunto de la ganancia diagnóstica alcanzada por la aplicación de la prueba, o contenido diagnóstico Γ (gamma) de la prueba es igual a la suma de estas dos ganancias diagnósticas: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) Pr | Pr Pr Pr | Pr | Pr | G G E T E E E T E T E T Γ = + + − Γ = + + − + + + − + −         = + + − + − El contenido diagnóstico Γ alcanzado por la aplicación de una prueba se mide por la diferencia entre las dos probabilidades postprueba de la enfermedad, que son obtenidas respectivamente por el resultado positivo y negativo de la prueba. Por ejemplo, una prueba con respuesta dicotómica cuyas cualidades diagnósticas son: 0,80 0,90 8 0,222 Se Es L λ = = = = es aplicable a la investigación de una enfermedad cuya probabilidad preprueba es 0,30. Si la respuesta de la prueba es “positiva”, la probabilidad postprueba de la enfermedad se eleva a: ( ) ( ) ( ) Pr | 1 1 0,30 8 0,77 0,30 7 1 P L E T VPP P L + + = = − + × = = × + La ganancia diagnóstica aportada por la respuesta positiva de la prueba es: ( ) 0,77 0,30 0,47 G VPP P + = − = − = Si la respuesta de la prueba es “negativa”, la probabilidad de la enfermedad baja a: ( ) ( ) ( ) ( ) Pr | 1 1 1 0,30 0,222 0,09 0,30 0,222 1 1 P E T VPN P λ λ + − = − = − + × = = × − + La ganancia diagnóstica obtenida por la respuesta negativa de la prueba, en valor absoluto es: ( ) ( ) 1 0,30 0,09 0,21 G P VPN − = − − = − = Las ganancias diagnósticas se pueden visualizar en la Figura 13. En función de la probabilidad preprueba P en abscisas, las dos curvas dan los valores de las probabilidades postprueba de la enfermedad E según que el resultado de la prueba sea positivo (curva superior) o negativo (curva inferior). La ganancia diagnóstica ( ) G + aportada por el resultado positivo es igual a la distancia OA; la ganancia ( ) G − aportada por un resultado negativo es igual en valor absoluto a la distancia OB; la ganancia total o contenido
  • 23. 23 diagnóstico Γ de la prueba cuando la probabilidad preprueba es 0,30, es igual a la distancia AB entre las dos curvas: Γ : 0,47 0,21 0,68 Γ = + = Figura 13. Ganancia diagnóstica obtenida por la respuesta de una prueba en función de la proba- bilidad preprueba. La figura muestra que la ganancia diagnóstica obtenida por la prueba tiende a anularse cuando la probabilidad primaria de la enfermedad se aproxima a los valores extremos 0 y 1. El cálculo muestra que la ganancia diagnóstica aportada por la respuesta positiva de la prueba es máxima cuando la probabilidad preprueba es igual a: ( ) 1 1 P L + = + En el ejemplo, ( ) 1 0,26 1 8 P + = = + En caso de respuesta negativa, la ganancia diagnóstica es máxima cuando la probabilidad primaria es: ( ) 1 1 P L + = + En el ejemplo, ( ) 1 0,68 1 0,222 P − = = + El contenido diagnóstico de la prueba es máximo cuando la probabilidad preprueba de la enfermedad es: 1 1 máx P Lλ = + En el ejemplo, 1 0,43 1 8 0,222 máx P = = + × . Esta probabilidad es aquella en que los dos valores predictivos positivo VPP y negativo VPN son iguales. En el ejemplo, cuando P es igual a 0,43 máx P = , los dos valores predictivos son 0,86 VPP VPN = = . Es cuando la probabilidad preprueba está próxima a valores medianos –próxima al 50 %– cuando la respuesta de la prueba aporta la información diagnóstica mas elevada (Figura 14). Este valor máx P de la probabilidad
  • 24. 24 preprueba es 0,50 cuando el producto 1 Lλ = , es decir cuando las dos razones de verosimilitud L y λ son inversas la una de la otra. Figura 14. Ganancia diagnóstica en función de la probabilidad preprueba P, aportada por una prueba cuyas cualidades diagnósticas son L = 8 y λ = 0,222 ( ) G + es la ganancia diagnóstica aportada por una respuesta positiva: su valor máximo se obtiene cuando: 1 0,26 1 P L − = + ( ) G − es la ganancia diagnóstica aportada por una respuesta negativa: su valor máximo se obtiene cuando: 1 0,26 1 P L − = + Γ es la suma de las dos ganancias, su valor máximo se obtiene cuando: 1 0,43 1 P L − = + 7. Comentarios Generalmente, sensibilidad y especificidad suelen tener una relación inversa, es decir, si la sensibilidad de una prueba es muy alta, es a costa de perder especificidad y viceversa. Cuando para el diagnóstico de una enfermedad existen varias pruebas posibles, la utilización de una u otra se hará atendiendo a las necesidades diagnósticas. Así en las pruebas de cribado, detección o screening, se utilizan, en general, pruebas de alta sensibilidad, mientras que en las pruebas de confirmación se utilizan técnicas de alta especificidad. Las pruebas con una alta sensibilidad se utilizan cuando se quiere diagnosticar correctamente a los pacientes enfermos. Por ejemplo, en el diagnóstico del cáncer de mama se utiliza un marcador tumoral específico. Si la paciente tiene cáncer pero la prueba diagnóstica no es capaz de detectarla, el tumor avanzará rápidamente y provocará un deterioro en la mujer que hará imposible un tratamiento posterior. Por esta razón la prueba debe detectar a todos los pacientes enfermos, aun a costa de diagnosticar incorrectamente a alguno sano, pues en las exploraciones complementarias que se realicen posteriormente, se detectará que el diagnóstico inicial era erróneo. Las pruebas con una alta especificidad se utilizan cuando se desea diagnosticar correctamente a todos los individuos sanos. Por ejemplo, en el diagnóstico del embarazo, si la prueba diagnostica incorrectamente a mujeres no embarazadas, no pasará nada puesto que en pocos días se verá que el diagnóstico era incorrecto.
  • 25. 25 8. Etapas de un estudio de evaluación de pruebas diagnósticas Debido a que una misma prueba diagnóstica puede ser utilizada para el estudio de varias situaciones clínicas (por ejemplo, el diagnóstico por imagen con resonancia magnética puede aplicarse a gran número de patologías), se tendrá que decidir cuál se va a evaluar. Para guiar esta decisión se deben tener en cuenta los siguientes factores: • Frecuencia de la enfermedad o estado. Se priorizarán aquellas aplicaciones que afecten a mayor número de personas; • Coste de la tecnología: las tecnologías más caras deben ser evaluadas con el máximo rigor para evitar gastos innecesarios al sistema sanitario; • Existencia de un criterio de referencia que permita la comparación; • Impacto potencial sobre el manejo del paciente: se debe hacer mayor esfuerzo en mejorar la calidad de las pruebas diagnóstica de las condiciones clínicas para las que hay tratamiento eficaz; • Impacto potencial sobre el resultado clínico. Se dará prioridad a la evaluación de aquellas pruebas, que en definitiva, contribuyan a la mejora del estado de salud de los pacientes; • Existencia de métodos diagnósticos inadecuados para la situación clínica bajo estudio. Una vez decidida la enfermedad o situación clínica que se va a estudiar, el diseño del estudio será similar al de cualquier otro estudio observacional y los pacientes elegidos no deberán diferir substancialmente de aquellos a los que posteriormente se aplicará la prueba. Se deben incluir, por tanto, pacientes con diversos estadios clínicos de la enfermedad, ya que si se escogieran sólo los más graves, por ejemplo, darían mayor número de positivos, aumentando de una forma ficticia la sensibilidad de la prueba. La elección del criterio de referencia resulta, en ocasiones, muy compleja, bien por ser costoso o potencialmente perjudicial para el individuo o porque simplemente no se ha desarrollado un mejor método de diagnóstico. Sin embargo, utilizar un criterio de referencia de baja calidad puede conducir, a que la nueva medida sea considerada falsamente de baja calidad. Por ejemplo, con un patrón áureo de baja sensibilidad muchos resultados positivos de la nueva prueba serán considerados erróneamente falsos positivos, disminuyendo el valor de la prueba. 9. Sesgos potenciales de los estudios sobre pruebas diagnósticas modo de producción consecuencias modo de control 1. Sesgo de selección no se tiene en cuenta el espectro clínico de la enfermedad o comorbilidad sobrestima Se y Es si se representan los casos graves; infraestima Se y Es si se representan los casos leves representar el espectro completo en la muestra; describir el espectro en el análisis; análisis de la prueba diagnóstica en los subgrupos 2. Sesgo de la prueba de referencia imperfecta no se dispone de una buena prueba de referencia y se usa la disponible (aunque no clasifique bien y discrimine correctamente sanos y enfermos). generalmente sobrestima Se y Es pero a veces los infraestima seguimiento clínicos de los pacientes para conocer si son enfermos o no; correcciones matemáticas si se dispone de un subconjunto de pacientes con una adscripción definitiva 3. Sesgo de incorporación elementos de la prueba diagnóstica forma parte de la prueba de referencia sobrestima Se y Es conceptualización adecuada de la prueba diagnóstica y de la prueba de referencia. 4. Sesgo de revisión o valoración ciega la interpretación de la prueba diagnóstica y la prueba de referencia se realiza conociendo el otro resultado, es decir, de modo no ciego sobrestima Se y Es enmascaramiento de las personas que interpretan (y realizan) la prueba diagnóstica y la prueba de referencia 5. Sesgo de secuencia o verificación diagnóstica el resultado de la prueba diagnóstica condiciona la realización de una prueba de referencia sobrestima Se e infraestima Es realización estándar en todos los pacientes del estudio; si no es posible hacerlo: seguimiento de las pruebas negativas y correcciones matemáticas
  • 26. 26 modo de producción consecuencias modo de control 6. Sesgo por resultados no interpretables es una eventualidad que se produce en cualquier prueba diagnóstica o de referencia sobrestima Se y Es repetición de la prueba si es posible; Inclusión en el estudio de los casos no interpretables 7. Sesgo por variabilidad en la interpretación de resultados diversos observadores que actúan dentro del estudio tienen diferentes Se y Es ; el mismo observador cambia su Se y Es dentro del estudio debido al entrenamiento generalmente infraestima Se y Es estudios previos (piloto) de consistencia inter e intraobservadores; correcciones matemáticas 10. Evaluación diagnóstica: jerarquización Nivel 1: Prestaciones técnicas. Las pruebas cumplen los criterios de calidad aceptables Nivel 2: Prestaciones diagnósticas. Los resultados de las pruebas diagnósticas permiten hacer diagnósticos precisos, es decir permiten identificar enfermos y no enfermos (eficiencia, valor predictivo, sensibilidad, especificidad, razón de verosimilitud, área bajo la curva ROC) Nivel 3 Impacto diagnóstico. Los resultados modifican la confianza que se tiene en el diagnóstico y evitan otros estudios Nivel 4: Impacto terapéutico. Los resultados de las pruebas intervienen en las decisiones terapéuticas y en que proporción Nivel 5: Impacto de los resultados. Los resultados de las pruebas contribuyen a mejorar el estado de salud de los pacientes Nivel 6: Impacto en la salud pública. Análisis coste beneficio y coste eficacia desde el punto de vista de la sociedad Bibliografía 1. Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York: Marcel Dekker; 1987. 2. Bermejo Fraile B. Epidemiología clínica aplicada a la toma de decisiones en medicina. Departamento de Salud. Gobierno de Navarra; 2001. www.cfnavarra.es/salud/docencia.investigacion/textos/Monograf_1/Epidemiologia_clinica.pdf 3. Escrig-Sos J, Martínez-Ramos D, Miralles-Tena JM. Pruebas diagnósticas: nociones básicas para su correcta interpretación y uso. Cir Esp 2006;79(5):267-273. 4. Grenier B. Décision médicale. Paris: MASSON; 1993. 5. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005;365(9469):1500-5. 6. Hayden SR, Brown MD. Likelihood ratio: A powerful tool for incorporating the results of a diagnostic test into clinical decisionmaking. Ann Emerg Med. 1999;33(5):575-80. 7. Redondo Alvaro FL. La lógica en la interpretación de las pruebas diagnósticas. Madrid: Garsi; 1989. www.epiredperu.net/epired/ppts/curso_estadistica-scsf/estadistica-scsf-14.pdf www.vhebron.es/ac/preventiva/docencia/mastphoenix/t06_pru_diagnosticas_diapos_fx.pdf www.fisterra.com/mbe/investiga/pruebas_diagnosticas/pruebas_diagnosticas2.pdf http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/6-Ayuda%20Pruebas%20diagnósticas.pdf www.uquebec.ca/reglog/chapitre9.htm http://www.spieao.uhp-nancy.fr/~kohler/LectureArticle/ www.med.univ.montpl.fr/Enseignement/cycle_2/c-ac-2eCR.htm