Ejercicio complementario 1

 Vamos a realizar un ejercicio en el que vamos a trabajar con varios conceptos y sobre todo con las curvas ROC. Puedes volver a leer las explicaciones si necesitas refrescar algunos conceptos💆.

Como hemos explicado en el post ¿Cuándo se si estoy enfermo?  las curvas ROC se utilizan para calcular el punto de corte óptimo para una prueba diagnóstica. Además se pueden utilizar para comparar y elegir las pruebas diagnósticas de las que hemos ido hablando en todos estos ejercicios.


Ejercicio. Estos son los valores de concentración de glucosa en sangre tras 2h horas de la ingesta de un preparado.

  • Completa las tablas de contingencia para los posibles puntos de corte de 70, 110 y 160mg/100mL. La muestra es de 71724 y el número de enfermos es 6570. 

  • Calcula para esas concentraciones de glucosa los valores VP+ y VP-. Razona la respuesta. 

  • Dibuja la curva ROC y razona el resultado. 

  • ¿Cuál es el punto de corte que elegirías para convertirlo en una prueba dicotómica? Razona el resultado. 

  • Calcula los valores RV+ y RV-. 

  • Calcula el índice de Youden y razona la respuesta. 

  • Si la prevalencia de los tres casos fuese del 33,4%, ¿cómo cambiarían las tablas de contingencia y los demás valores?


Completa las tablas de contingencia para los posibles puntos de corte de 70, 110 y 160mg/100mL. La muestra es de 71724 y el número de enfermos es 6570. 

Vamos a construir las tablas de contingencia para las concentraciones que se nos piden (marcadas con color en la tabla). Por lo tanto, tenemos que hacer tres tablas de contingencia, para 70mg/ml, 110 mg /100ml y por último 160mg/100ml. Para cada una de ellas necesitaremos utilizar sus sensibilidades (S) y especificidades (E) que aparecen en la tabla. Con la S y la E, la muestra y el número de enfermos podemos calcular los datos para rellenar las tablas de contingencia. 


Para 70 mg/100 mL

Primero a partir de la sensibilidad, que es en este caso 98.6%, y el número de enfermos calculamos los verdaderos positivos. 


S = VP/(VP+FN) =  0,986 → VP = (VP+FN) · S → VP = 6570 · 0,986 = 6478,02


Tenemos 6478 verdaderos positivos.


Con el número de enfermos y con los verdaderos positivos podemos calcular los falsos negativos.


VP + FN = Total enfermos → FN = Total enfermos - VP = 6570 - 6478 = 92 


Tenemos 92 falsos negativos.


Por otro lado, calculamos los verdaderos negativos utilizando la especificidad 88% y el número de personas sanas.


E = VN/(VN+FP) = 0,088 → VN = (VN+FP) · E →  VN = 65154 · 0,088 = 5733,552


Tenemos 5734 verdaderos negativos.


Con el número de sanos y con los verdaderos negativos podemos calcular los falsos positivos.


VN + FP = Total sanos → FP = Total sanos - VN = 65154 - 5734 = 59420


Tenemos 59420 falsos positivos.


La tabla de contingencia para 70 mg/ 100 mL quedaría así:




REALIDAD para 70 mg/ 100 mL



Enfermos

Sanos

Totales

Prueba

+

6478 (VP)

59420 (FP)

65898

-

92 (FN)

5734 (VN)

5826

Totales

6570

65154

71724


Para 110 mg/ 100 mL

En la siguiente tabla calcularemos y seguiremos los mismos pasos que en la tabla de contingencia anterior utilizando de nuevo la sensibilidad y la especificidad, que en este caso es 85,7 y 84,1 respectivamente. Primero calcularemos los verdaderos positivos y luego los verdaderos negativos


S = VP/(VP+FN) =  0,857 → VP = 5630,49 → 5630 verdaderos positivos

VP + FN = Total enfermos → FN = 940 → 940 falsos negativos


E = VN/(VN+FP) = 0,841 → VN = 54794,51 → 54795 verdaderos negativos

VN + FP = Total sanos → FP = 10359 → 10359 falsos positivos


La tabla de contingencia para 110 mg/ 100 mL quedaría así:



REALIDAD para 110 mg/ 100 mL



Enfermos

Sanos

Totales

Prueba

+

5630 (VP)

10359 (FP)

15989

-

940 (FN)

54795 (VN)

55735

Totales

6570

65154

71724


Para 160 mg/ 100 mL

En la última tabla de contingencia repetiremos los mismos pasos para calcular de nuevo los verdaderos positivos y los verdaderos negativos. En este caso, la sensibilidad es 47,1 y la especificidad es 99,8.

S = VP/(VP+FN) = 0,471  → VP = 3094 → verdaderos positivos

VP + FN = Total enfermos → FN = 3476 → 3476 falsos negativos


E = VN/(VN+FP) = 0,998 → VN = 65024 → 65024 verdaderos negativos

VN + FP = Total sanos → FP = 130 → 130 falsos positivos


La tabla de contingencia para 160 mg/ 100 mL quedaría así:




REALIDAD para 160 mg/ 100 mL



Enfermos

Sanos

Totales

Prueba

+

3094 (VP)

130 (FP)

3224

-

3476 (FN)

65024 (VN)

68500

Totales

6570

65154

71724


Calcula para esas concentraciones de glucosa los valores VP+ y VP-. Razona la respuesta.

Los valores predictivos positivos (VP+) los calculamos sabiendo los verdaderos positivos, dividido por la suma de estos y los falsos positivos.



Los valores predictivos negativos (VP-) los calculamos con los valores verdaderos negativos y los dividimos entre la suma de ellos y los falsos negativos.


Para 70mg/100mL 

  • VP+ = VP/(VP+FP) = 6478/(6478+59420) = 0,098

  • VP- = VN/(VN+FN) = 5734/(5734+92) = 0,984


Para 100 mg/100 mL

  • VP+ = VP/(VP+FP) = 0,352

  • VP- = VN/(VN+FN) = 0,017


Para 160 mg/ 100 mL

  • VP+ = VP/(VP+FP) = 0,960

  • VP- = VN/(VN+FN) = 0,051


En la siguiente tabla están todos los valores predictivos positivos y negativos a cada concentración:



VP+

VP- 

70 mg/ 100 mL

0,098

0,984

100 mg/ 100 mL

0,352

0,017

160 mg/ 100 mL

0,960

0,051



Dibuja la curva ROC y razona el resultado. 

Para empezar, recordamos que en la representación de este tipo de gráficas tenemos en el eje x, el eje horizontal, 1 - E (especificidad) y en el eje y tenemos S (sensibilidad). Para realizarla tenemos que coger todos los valores de la primera tabla que nos da el problema y no solo las tres filas que hemos utilizado anteriormente para calcular las tablas de contingencia. En nuestro caso, usamos excel, creamos una hoja de cálculo y copiando los datos, los seleccionamos y le damos a añadir gráfico. 

 


¿Cuál es el punto de corte que elegirías para convertirlo en una prueba dicotómica? Razona el resultado. 

En la explicación de las curvas ROC vimos que cuando teníamos una variable continua necesitamos determinar un punto de corte. Esto nos servirá para decir a partir de que valor una persona está enferma o sana. Una de las mejores formas para calcular el punto de corte es mediante el índice de Youden. Podemos calcular el índice de Youden para los datos de especificidad y sensibilidad de la tabla y seleccionar el más cercano a 1, que indicará el punto de corte. La fórmula del índice de Youden es:

Nosotros hemos calculado el índice de Youden para cada concentración mediante excel. En este caso, el valor del índice de Youden más alto corresponde a la concentración de 110 mg/ 100 mL.

YI = 0,857 + (0,841 - 1) = 0,698


Por tanto, el punto de corte que elegiremos para la prueba es 110 mg/ 100 mL


Calcula los valores RV+ y RV-. 

Ahora vamos a calcular los valores de las razones de verosimilitud (RV). En este caso solo utilizamos las concentraciones de glucosa usadas en las tablas de contingencia de los primeros apartados. Teniendo la sensibilidad y la especificidad en la tabla que nos aporta el problema lo único que tenemos que hacer es sustituir cada una de ellas en la fórmula para obtener dichos valores.


Razón de verosimilitud positiva RV+


Razón de verosimilitud negativa RV-


RV+

RV- 

70 mg/ 100 mL

1,081

0,159

100 mg/ 100 mL

5,390

0,17

160 mg/ 100 mL

235,5

0,53


Calcula el índice de Youden y razona la respuesta. 

En la siguiente pregunta nos vuelven a preguntar por el índice de Youden, que como recordamos nos ayudaba a calcular la validez de nuestra prueba diagnóstica. Para esto de nuevo necesitaremos la sensibilidad (S) y la especificidad (E) para poder aplicarla directamente en la fórmula vemos abajo. En este caso calcularemos de nuevo solamente el índice de Youden de las concentraciones de glucosa de las tablas iniciales.  





Índice de Youden = S + (E-1)

70 mg/ 100 mL

0,074

100 mg/ 100 mL

0,698

160 mg/ 100 mL

0,469


Si la prevalencia de los tres casos fuese del 33,4%, ¿cómo cambiarían las tablas de contingencia y los demás valores?

Los únicos conceptos que dependen de la prevalencia son los valores predictivos, tanto positivo como negativo. Los demás valores no dependen de la prevalencia y por tanto se van a quedar igual. 

Si tenemos una prevalencia alta, tendremos un valor predictivo positivo (VP+) alto (la mayoría de los positivos serán verdaderos positivos) y un valor predictivo negativo (VP-) bajo (tendremos bastantes falsos negativos).

Si tenemos una prevalencia baja, tendremos un valor predictivo positivo (VP+) bajo (tendremos bastantes falsos positivos) y un valor predictivo negativo (VP-) altos (la mayoría de los negativos serán verdaderos negativos).


Vuelta a la entrada


Comentarios