Las matemáticas españolas asumen contra reloj el reto de predecir la evolución de la epidemia
- Saber más, para hacer más
- 9 ene 2020
- 5 Min. de lectura
Actualizado: 20 abr 2020
España pide predicciones sólidas que le ayuden a decidir cuánto prolongar el estado de alerta. Los investigadores deben primero conseguir los muchos datos que necesitan y que están dispersos por comunidades autónomas e instituciones. Después tendrán que armonizar los resultados de numerosos modelos distintos. Todo en apenas una semana.

SINC.- Para los expertos en modelos, el coronavirus llega con redoble de tambores: el sonido del momento de la verdad.
Los matemáticos españoles llevan tiempo divulgando la utilidad de su ciencia en epidemias y las autoridades sanitarias les han tomado la palabra.
Según explican a SINC los propios investigadores, les piden predicciones a corto plazo de las variables de mayor interés en la expansión del virus.
Ahora, decenas de matemáticos en España trabajan contra reloj para ayudar a decidir, en los próximos días, la duración de las medidas excepcionales.
No solo se juegan en parte su prestigio —¿y si las predicciones fallan?—, sino que lo hacen con viento de frente. Su primer reto es conseguir y armonizar datos indispensables para los modelos y hasta ahora ausentes.
Después tendrán que poner orden en los modelos y estimaciones que grupos independientes han elaborado en las últimas semanas. Por ahora “unos veinticinco grupos han puesto enlaces a sus modelos en la web de CEMat”, señala Alfonso Gordaliza, coordinador de la Acción Matemática contra el Coronavirus.
El Comité Español de Matemáticas (CEMat), que integra varias sociedades en España, lanzó esta iniciativa el pasado 26 de marzo “para poner a disposición de las autoridades nuestra capacidad de análisis y modelización”, indica el texto.
Los investigadores se ofrecían para abordar la evolución de la epidemia en todo el país y por comunidades autónomas, y “a nivel local en el caso de las grandes ciudades”, incluyendo “casos confirmados, hospitalizados y en UCI”; también, para dar soluciones de logística y gestión de recursos escasos —desde mascarillas a respiradores—; y, por supuesto, para estimar “el efecto que tendrían los cambios en las medidas de confinamiento y de distanciamiento social”.
Pero ponían un ‘precio’ a su oferta: datos. Desde “(…) series de datos diarios de la epidemia, completas y desagregadas por CCAA y por rangos de edad y sexo (…), casos confirmados, fallecidos, curados, hospitalizados en la UCI (…)”, hasta “curvas diarias de variables meteorológicas —para estimar su efecto en la epidemia—“, y microdatos como fechas de contacto con infectados y de primeros síntomas, ubicación de domicilio y trabajo, patologías previas…”.
Solicitaban incluso “registros de movilidad de la población (ficheros big data), incluyendo también los que está recabando el INE con la colaboración de algunas compañías de telefonía móvil”.
Datos para nutrir modelos
“Sin los datos los modelos no funcionan”, insistía Gordaliza a SINC el día que se lanzó la iniciativa. “Los matemáticos podemos hacer mucho, queremos ser útiles, pero necesitamos datos”.
Sin embargo, por entonces varios grupos españoles ya habían presentado resultados de varios modelos, de distinto tipo y predicciones diversas. Sin poner en duda la buena voluntad de estos grupos, algunos expertos comentaban en privado lo arriesgado de esta práctica.
Alertaban de que la falta de datos aboca a grandes niveles de incertidumbre en las predicciones, lo que, si no se explica bien, introduce ruido en el sistema y puede conducir, además de al desprestigio de la disciplina, a la toma de decisiones erróneas.
El 22 de febrero algunos medios recogían las estimaciones de un modelo español que preveía no más de 10 personas infectadas en España y ningún muerto. El 13 de marzo otro titular anunciaba el pico de la epidemia en España para el 31 de marzo. El 18 de marzo otro grupo en Valencia trasladaba el pico a entre el 10 y el 25 de abril. El mismo día, matemáticos catalanes decían en la radio que sería en verano.
La hemeroteca no solo saca los colores a predicciones españolas; también grupos internacionales han hecho estimaciones erróneas, incluida la OMS, en gran medida por el gran desconocimiento de los parámetros esenciales para modelizar una enfermedad causada por un patógeno del todo nuevo para la ciencia.
Pero en España ese problema de base se agrava por el hecho de que datos de los que en teoría sí se dispone no están fácilmente organizados.
La oferta de los matemáticos obtuvo respuesta el 31 de marzo: “El Gobierno se ha hecho eco del ofrecimiento de CEMat”, informaban en un email los responsables de la Acción Matemática contra el Coronavirus a sus colegas matemáticos.
“Se nos piden predicciones a corto plazo de las variables de mayor interés en la expansión del virus de la COVID-19, tanto globales de toda España, como desagregadas por CCAA (…) se hace un llamamiento a (…) la comunidad Matemática/Estadística para que pongan a punto sus modelos predictivos y los contrasten con otros colegas, para poder hacernos llegar en los próximos días sus aportaciones”.
La respuesta, sin embargo, no ha llegado con paquetes de datos fácilmente organizados. Su recopilación depende en parte de los propios investigadores.
“No nos han descargado los datos así, en una caja en la mesa; no es tan sencillo, en gran medida porque lo que necesitamos está en distintos sitios, desestructurado, a veces hay que pedirlo en los propios hospitales”, explica un miembro del CEMat. “Lo que hemos entendido es que tenemos vía libre para solicitarlos”.
Inteligencia colectiva
Algunos grupos ya estaban en contacto con las autoridades sanitarias de sus comunidades; otros están creando ahora los canales. Algunas fuentes no serán sanitarias, sino, por ejemplo, empresas de telecomunicaciones.
Un aspecto crucial para entender cómo se mueve la pandemia es saber, lógicamente, cómo se mueven las personas. Las grandes compañías tienen los datos anonimizados procedentes de los usuarios de móviles, y su uso en este contexto no entra en colisión con la ley de protección de datos.
Varios matemáticos recuerdan a SINC la gran utilidad que han demostrado tener estos datos en países como Corea del Sur y restan importancia a la posible pérdida de privacidad: “En la situación actual ya estamos perdiendo muchas libertades, que se pueda acceder a datos anonimizados sobre posicionamiento, en aras de un bien común, no debería preocuparnos”, apunta Gordaliza.
El siguiente gran desafío, una vez convenientemente alimentados los modelos, será poner orden en las predicciones. El objetivo es hacer una especie de metamodelo, desarrollar una inteligencia colectiva, de enjambre, capaz de generar recomendaciones útiles para la toma de decisiones.
Probablemente no será fácil. Los modelos son de distintos tipos y, dadas las incertidumbres, han tenido que ser construidos sobre valores hipotéticos que cada grupo ha optado por estimar.
Por ejemplo el de Juan José Nieto, de la Universidad de Santiago de Compostela, otorga peso a la figura de los superpropagadores.
El 4 de marzo, cuando se hizo público el primer caso en Galicia, lanzaron su predicción de que el pico se alcanzaría en España la primera semana de abril: “Entonces nos parecía una barbaridad, revisamos los datos varias veces y nos alarmamos. Los pasamos a las autoridades gallegas, que se alarmaron más aún, porque por entonces aún estaba la convocatoria de elecciones autonómicas”, recuerda Nieto. Por ahora ellos mantienen sus previsiones.
Comments