Una de las cosas que aprendí cuando estudié un programa de Análisis de Datos en la Universidad John Hopkins era lo importante de definir correctamente la pregunta estadística para la que se quieren los datos.
Los datos por sí pueden decir una cosa y la contraria. Los datos no son respuestas, pero pueden imposibilitar obtenerlas si nos los escogemos con cuidado.
En estos días de aislamiento social se ha disparado el número de emisores de ruido en todos los canales de comunicación. Permitidme definir mejor este concepto de «emisor de ruido».
Todos hemos atendido a prensa, radio, TV, redes sociales buscando información que nos permita un poco de esperanza ante la dureza de la realidad que percibimos. Por desgracia, información es lo que menos hemos encontrado. Sí hemos visto a muchos «expertos» que opinan sobre los datos, pero información más bien poca.
Si tenemos en cuenta que los datos están cambiando constantemente, y que hay muchos datos duplicados en la información proporcionada (ver gráfica adjunta con los paises con más de 100 datos duplicados), la limpieza de los mismo y la meticulosidad del tratamiento ha de ser esquisita.
Los más confiables de estos opinadores o bien trabajan con sus propios informes, o bien son expertos en alguna de las materias (epidemiologos principalmente) que varían en sus análisis día a día en muchos de los casos.
La razón principal de dichas variaciones (más allá del show mediático necesario para que la rueda siga girando) es la defectuosa calidad del dato con la que se está trabajando, y la imposibilidad de definir algunas de las preguntas estadísticas necesarias, y la necesidad de establecer un discurso no científico con otros objetivos más allá de esta pandemia.
Además nos encontramos con que los resultados de los análisis pueden discrepar con nuestras percepciones, con lo que el sesgo congnitivo (lo que esperamos encontrar porque es lo que percibimos o creemos) campa a sus anchas.
Personalmente me hago mis propios informes y comparativas que pueden ser aproximadas con las que se publican, pero que honestamente no me están dando respuestas a la eficiencia de las medidas que nuestro Gobierno, o de otros paises puedan estar tomando. Más allá de que está claro que si no salimos, no nos contagiamos, muchas otras respuestas siguen en el aire.
No hablo de economía, o de libertades, o de cualquier otro elemento subjetivo. Estoy hablando de contagios y de muertes. Nos faltan datos, y muchos de los que tenemos no son buenos. La credibilidad de los datos es la primera de las cosas a analizar y para ello es necesario que haya unos criterios mínimos que se compartan.
Pongamos el caso de los «fallecidos por coronavirus». Más allá de la lamentable realidad que puedan mostrar, los criterios para el registro de una muerte como muerte por esta causa difieren de una población a otra. Unos emplean los fallecidos en hospitales con pruebas confirmadas, otros todos los que puedan ser sospechosos, otros corrigen el dato con los excesos sobre muertes previstas, otros no consideran las muertes si existe algún otro parámetro de comorbilidad (enfermedades previas que puedan producir el deceso), etc.
Con estas variaciones es complicado indicar que un país u otro lo pueda estar haciendo mejor o peor. No se nos indican características socioeconómicas o culturales que puedan o no afectar.
¿Qué día es el día 0? En unos casos los estudios emplean cuando haya más de 100 casos confirmados, otros cuando sean más de 500, otros indican que el parámetro a seguir debe ser cuando la tasa de contagio supere un determinado número de contagios por millón de habitantes. Sea como sea, esta disparidad hace difícil el análisis.
No me voy a extender más. No quiero ser un emisor de ruido más, pero la próxima vez que os digan tal o cual cosa sobre la situación o los escenarios que se van a producir, preguntaos dos cosas: ¿de dónde saca la información para llegar a esa opinión? ¿Me está mostrando datos validos que sustenten dicha opinión? Puede que no os respondan a vuestras dudas, pero seguro que recordaréis la frase atribuida a W. Edwards Demin: «Solo confiamos en dios, los demás tienen que traer datos».
Que estéis seguros y bien.