En contra de las gráficas de medios de comunicación sobre COVID-19

En contra de las gráficas de los medios de comunicación sobre el COVID-19

Saludos Curiosos!!!

Volvemos a tratar el tema más importante del momento: El coronavirus SARS-COV-2 que ocasiona la enfermedad conocida como COVID-19. 

El título de esta entrada es provocador, pero no me gustaría que se tomase como un ataque, simplemente quiero compartir mis reflexiones sobre un par de gráficas que aparecen en los medios de comunicación y que a mi juicio son erróneas o inútiles en el sentido de que no representan fielmente la realidad y pueden dar lugar a conclusiones equivocadas.

De acuerdo a los teóricos de la visualización:
El objetivo principal de la visualización de datos es comunicar información o ideas complejas de forma clara, precisa y eficiente, de forma que ayude a los usuarios a analizar y razonar sobre datos y evidencias. [inlab.fib.upc.edu]

Por lo tanto, el objetivo de las gráficas tiene que ayudar a analizar la situación, en este caso nos debe ayudar a comprender la situación actual y nos debe ayudar a comprender si estamos mejor o peor que antes.

Voy a hablar de (1) la gráfica apilada de casos, recuperados y muertes y de (2) la gráfica de incremento de casos, a mi juicio la peor es la segunda, pero empiezo por la otra para aclarar algunos términos que voy a usar más adelante.

Gráfica apilada de casos, recuperados y muertes.

Esta gráfica aparece en TODAS las emisiones del programa de RTV1 "Coronavirus última hora" que se emite de de lunes a viernes de 13:00 a 15:00.

Esta gráfica es una gráfica de área apilada, que en el eje x tiene los días y en el eje y acumula los fallecidos (en rojo), los recuperados (en verde) y los contagiados (en amarillo), apilando los datos de las tres cifras..

Como se puede ver en las imágenes de un poco más abajo, es una gráfica tan alta que hasta tiene que hacer una especie de "travelling" hacia arriba para mostrarla entera.

El fallo de esta gráfica es el siguiente: magnifica el número de casos a medida que pasa el tiempo

Y la razón es la siguiente: Cuando una persona pasa a formar parte del grupo de "recuperados" o "fallecidos" aparece representada de manera doble, puesto que se representa tanto en "contagiados" como en "recuperados" o "fallecidos".

Esta es una gráfica que es más engañosa a medida que pasa el tiempo. En el momento final de la epidemia cuando todo el mundo esté recuperado y varios miles de personas hayan tristemente fallecido, todas las personas estarán representadas dos veces.

Primera parte de la gráfica, que es tan alta que no cabe ni en la pantalla del televisor.

La imagen va haciendo travelling y zoom a la vez que muestra los datos en la parte izquierda.

Como novedad incorporaron los datos desglosados por comunidades, que tienen el mismo efecto.

¿Cuales serían las alternativas y por qué son mejores?

En todas estas gráficas en las que se muestran de manera conjunta fallecidos, recuperados y casos positivos en mi opinión son recomendables dos aspectos:
  • Considerar casos activos en lugar de considerar casos totales:  Al incluir en la gráfica los recuperados y los fallecidos, si consideramos casos totales en lugar de casos activos estamos incluyendo a la misma persona dos veces. Ademas, queremos que la gráfica muestre la situación actual de gravedad de la epidemia y eso se muestra con los casos activos, que son los casos que pueden infectar o que pueden llegar a fallecer.
  • No apilar: Apilando magnificamos el efecto. Una persona ya recuperada no representa ningún riesgo para los demás y no tiene riesgo de llegar a fallecer. No queremos que las cifras de recuperados magnifiquen el efecto de los casos activos.
Veamos dos ejemplos de gráficas más correctas, el primero es con los datos reales a fecha de hoy a nivel de España. La gráfica es de Activos, Fallecidos y Recuperados y no se encuentra apilada. 

Se aprecia mucho más clara la tendencia que siguen cada una de las curvas, podemos ver como el número de casos activos se está frenando, aunque todavía no hemos llegado al pico y vemos como los recuperados se aceleran levemente.
Gráfica de áreas no apilada de activos, recuperados y fallecidos a nivel nacional. Elaboración propia a partir de datos del Instituto de Salud Carlos III.

En algunas comunidades la gráfica es aún más interesante. La siguiente es con los datos de Islas Baleares, una de las comunidades que mejor lo está haciendo. Con esta gráfica vemos claramente como se alcanzó el pico de casos activos el 31 de marzo y desde entonces está bajando. 

El 7 de abril el número de recuperados superó al número de activos, esto es importante, aunque los datos reales (imposibles de saber) sean mayores que los oficiales, la proporción entre ambas variables si que se mantiene. A partir del 7 de abril, cualquier persona con la que interactuemos en la calle, en Islas Baleares tiene más posibilidades de ser inmune que de ser infecciosa.

Con esta gráfica se aprecian mejor este tipo de cosas.
Gráfica de áreas no apilada de activos, recuperados y fallecidos en Islas Baleares. Elaboración propia a partir de datos del Instituto de Salud Carlos III.

Hemos visto que con los datos de Islas Baleares y la gráfica correcta se aprecian varias cosas interesantes, vamos a ver que pasa con la gráfica "mala".
Si hacemos la gráfica de la misma manera que el programa de RTVE no somos capaces de sacar ninguna conclusión, ni rastro del pico en el número de personas activas, ni rastro de cuando el número de inmunes supera a los contagiosos, ni rastro de nada.

Gráfica apilada de contagios, fallecidos y recuperados (la mala), con los datos de Islas Baleares. Elaboración propia a partir de datos del Instituto de Salud Carlos III.


La gráfica del incremento de casos

Aquí viene lo peor, esta gráfica se usa continuamente por absolutamente todos los medios de comunicación, aunque si tenemos que nombrar a alguien especialmente aficionado a la gráfica ese es Ferreras, del programa ARV de la Sexta. Ferreras puede pasarse literalmente media hora cada día hablando de una gráfica que no representa nada, como argumentaré a continuación.

Captura del programa de Al Rojo Vivo con la gráfica de incremento de casos.

 ¿Qué muestra esta gráfica?

Esta gráfica muestra el porcentaje de nuevos casos con respecto al total de casos acumulados.

Incremento = (Nuevos Casos / Total de casos) * 100.

¿Por qué no vale para nada esta gráfica?

En esta gráfica el denominador siempre va a crecer a una velocidad mayor que el numerador. Puesto que el denominador es un sumatorio de los nuevos casos de todos los días desde el comienzo de la serie.

Debido a lo anterior, la gráfica siempre va a tener una tendencia descendiente independientemente de lo buena o mala que sea la situación real.

Al usar el número total de casos y no los casos activos (que son las personas que pueden contagiar) tampoco nos da una idea de la tendencia que está teniendo la tasa de contagios o R0.

Todo controlado, el incremento de casos está bajando.

La gráfica de incremento de casos es mala porque:
  • Nos hace creer que la situación mejora y que el número de casos activos es menor, cuando puede ser al contrario. 
  • Nos hace pensar que la tasa de contagio baja, cuando puede ser todo lo contrario.
  • No nos da ninguna información útil como por ejemplo saber si hemos alcanzado el pico de la tasa de contagios.

Ejemplos prácticos que demuestran que la gráfica de incremento de casos no representa nada.

A continuación muestro los datos de unas epidemias hipotéticas, generadas con el modelo SIR y unos parámetros para R0, beta y gamma como los que aparecen en el título de las figuras.

Epidemia 1: Suavecita.

Tenemos una isla, con 1000 habitantes y hay inicialmente un contagiado. La epidemia se reproduce con un R0 = 1.5. Cada infectado contagia a 1.5 personas de media.

En aproximadamente 110 días se llega al pico de casos activos, que son 64 personas (no tengo ojo milimétrico, es que he mirado el código, ventajas de hacer la simulación yo mismo, no os preocupéis que debajo tenéis un link al código.)


La gráfica de casos tiene una saludable tendencia descendente, partiendo poco más de un 10% hasta llegar casi a 0.
Epidemia 2:Jodidilla

Otra Isla, también 1000 habitantes, un infectado y un gobierno más torpe que no pone a tiempo las suficientes medidas de contención, no tiene EPIS para los médicos, hace pocos tests, etc etc. La tasa de contagio es de 2.5 (cada infectado contagia a 2.5 personas). 

La cosa se pone mucho peor, para el día 43, más del 20% de la población está infectada, muchos de ellos ingresan en hospitales, necesitan respiradores, no hay para todos y muchos fallecen (no se de que me suena esto).


Ahora miramos la tabla de incremento y joder, es incluso mejor, el incremento de casos parte de un 20% pero baja mucho más deprisa y mucho antes.

¿Como es posible?
El incremento de casos se calcula poniendo en el denominador el total de casos, así que si la epidemia fue muy virulenta al principio (el gobierno no fue previsor y la cagó) esta gráfica desciende muy rápidamente, por el total acumulado de casos es muy alto.

La gráfica favorece a países que lo han hecho mal, es la anti-gráfica. Las peores situaciones aparecen como mejores. 

¿Cuales serían las alternativas y por qué son mejores?

Veamos los datos de Islas Baleares, que son de los mejores de España en el momento de escribir el blog. Realmente no vemos nada.

Gráfica de incremento de casos (la mala), con los datos de Islas Baleares. Elaboración propia a partir de datos del Instituto de Salud Carlos III.
Una alternativa mejor es la gráfica de incremento/decremento de casos activos.

En cada día se calcula la diferencia de activos (Δ Activos), que puede ser positiva si hay más casos activos o negativa, si hay menos, partido por el total de casos activos. Los nuevos casos solo pueden ser positivos o cero, nunca negativos.

Porcentaje de Incremento/Decremento de casos activos = (Δ Activos / Casos activos) * 100

Esta gráfica es muy interesante porque cuando corta el 0 significa que hemos llegado a un pico en el número de contagios. El pico de contagios activos es interesante, porque es el momento en el que tenemos más posibilidades de cruzarnos con un inmune que con un contagioso, es cuando el tema empieza a mejorar.

La gráfica puede cortar el 0 varias veces, porque a veces se trata solo de un máximo local y al cabo de varios días se produce el pico absoluto.
Gráfica de porcentaje de incremento/decremento de activos (la buena), con los datos de Islas Baleares. Elaboración propia a partir de datos del Instituto de Salud Carlos III.
La información de la gráfica se puede mejorar. En la gráfica anterior no sabemos si la mejora se debe porque hay menos contagios o porque hay más curaciones. 

Se pueden representar por separado el cambio en los activos (más o menos activos respecto al día anterior) y el cambio de los no-activos (más o menos recuperaciones respecto al día anterior).

Cuando la línea verde se encuentra por encima de la amarilla es cuando empezamos a tener más recuperaciones que nuevas infecciones. No solo vemos el pico, sino que vemos si es por un descenso de contagios o por un aumento de recuperaciones o ambas cosas a la vez.
Gráfica de incremento/decremento de activos y no activos (aún mejor), con los datos de Islas Baleares. Elaboración propia a partir de datos del Instituto de Salud Carlos III.

Conspiraciones y especulación

Parece que está claro que la gráfica de incremento de casos no sirve para nada, la cuestión entonces es ¿por qué se usa?.

Aquí no puedo hacer otra cosa que especular, mi opinión es que se usa intencionadamente a sabiendas de que es inútil e induce a error. Por dos motivos:
  1. El lunes 13 de abril se tenía que volver al trabajo en aquellas profesiones no esenciales y había que transmitir la idea de que la situación estaba mejorando mucho y muy bien.
  2. La gráfica de incremento de casos no permite ver el pico de casos activos. El presidente y varios ministros nos llevan diciendo que estamos llegando o que hemos llegado desde hace semanas y claro eso es muy fácil de ver que es falso si se usa la gráfica adecuada. En la siguiente gráfica se ven en porcentaje el incremento/decremento de casos activos a nivel de España. La gráfica no corta el 0 en ningún momento. A día de publicación del blog no se ha llegado al pico de casos activos en España, por mucho que nos digan desde hace semanas que si. Cada día que pasa sigue habiendo más personas con la enfermedad en curso y que pueden contagiar. Sería un insulto a los espectadores decir que se está llegando al pico. mientras vemos una gráfica muestra que no, por eso mejor usar gráficas que no permiten detectarlo. No os preocupéis que después de pasar el pico igual si que se usan.
Pero claro, esta es solo mi opinión, que cada uno llegue a sus conclusiones. Como dato curioso, las versiones "correctas" de las gráficas si que aparecen en webs académicas, técnicas o científicas, pero no son frecuentes en los medios de comunicación.
Gráfica de porcentaje de incremento/decremento de activos (la buena), con los datos de España. Elaboración propia a partir de datos del Instituto de Salud Carlos III.



Si quieres saber más sobre el modelado de epidemias puedes consultar la entrada anterior del blog aquí o puedes leer el libro Las matemáticas vigilan tu salud: Modelos sobre epidemias y vacunas (El Café Cajal). Amazon (aunque hablo de el mucho, no es mio, no es SPAM no os preocupeis).

Los datos de las gráficas del modelo SIR se han generado utilizando código del siguiente tutorial.




Si te ha gustado puedes compartir esta publicación en Twitter

O puedes seguirme en Twitter o Facebook para estar al tanto de otras publicaciones como esta



No hay comentarios:

Publicar un comentario

Taxis autónomos, ahora si!

  Saludos Curiosos!! Esta vez venimos con una noticia que está pasando desapercibida a pesar de su importancia. Los taxis autónomos ya están...

Entradas más populares