Ecuador
La importancia de los datos en momentos de crisis
Por: Ing. Diego Riofrío Luzcando, doctor.
Director Digital School de la Universidad Internacional SEK
En estos días de incertidumbre todos nos levantamos pensando: "¿Cuántos nuevos infectados habrá hoy de COVID-19?". Buscamos en todos lados, intentando saciar esa imperante necesidad de información que tenemos en esta nueva era, en la que circulan millones de datos de distintas fuentes y países.
En el Ecuador, los datos oficiales se presentan por medio de la fuente oficial representada en el Servicio Nacional de Gestión de Riesgos y Emergencias, los cuales además son publicados en sus redes sociales y su página web. Sin embargo, estos datos no pueden ser tomados a la ligera y es necesario hacer un análisis más profundo en miras de sacar conclusiones basadas en las evidencias. Los datos que presentan los organismos oficiales muestran simplemente una tabla actualizada de frecuencias que intenta describir la situación del momento. Es decir, un conteo de los tests positivos, los decesos, las altas hospitalarias, edades, provincias, pruebas por confirmar, y otros.
Con la intención de que la población se informe por medio de un gráfico en poco tiempo. Es por ello, que toma cada vez más importancia que los analistas de datos sepan como mostrar esta información de una manera visual, fácil de entender y que sobre todo se adapte a los públicos a los que van dirigidos. Ahora bien, ¿se puede predecir cuántos nuevos positivos habrá mañana? La respuesta a esta pregunta es sí, se lo puede hacer. Para ello, es necesario regresar al panorama mundial, donde se han recogido más datos desde el inicio de la pandemia.
En este caso empezaremos el análisis con los datos históricos de los nuevos contagiados en cada día, los cuales podemos obtenerlos en el portal de datos abiertos de Europa, actualizados al día. En esta página también se reflejan los datos del Ecuador.
Realizando un análisis descriptivo de los datos, se puede ver que en un inicio el crecimiento del número de nuevos infectados en cada día seguía una función exponencial, tal y como pronosticaron los expertos. Es decir, que una persona contagiada podía mañana enfermar a otras tres, esas tres al día siguiente podían expandirlo cada una a tres más, y así multiplicándose cada día el número de nuevos contagiados.
Si los datos mostraran que el comportamiento del número de infectados sigue una función exponencial, podríamos decir “mañana existirán N positivos con una probabilidad del X %”.
Sin embargo, en la Figura 1 se puede ver que desde un punto en el tiempo los datos ya no siguen una función de este tipo, por lo que ya no es tan fácil predecir que puede pasar en un futuro.
¿A qué se debe este cambio? Puede ser por otras variables no analizadas en este momento por ejemplo decisiones de política pública como el #QuédateEnCasa, inversiones en materia de salud, etcétera, las cuales proponemos sean analizadas mediante el uso de técnicas de Business Intelligence, en donde los datos puedan ser utilizados por expertos en políticas pública para sacar conclusiones.
Aterrizando el análisis en nuestro país, se puede ver en la Figura 2 que se produce un fenómeno similar al antes explicado. Con respecto a la Figura 3 no es pertinente comparar todavía (y esperemos que nunca sea pertinente) con los casos en España e Italia de las mismas fechas, ya que el número de infectados en un día de esos países es casi 30 veces mayor que el nuestro y no ayuda en el análisis. Sin embargo, China en este último mes ha tenido un comportamiento de nuevos infectados algo peculiar.
Entonces, luego de este análisis vuelvo a la pregunta inicial: ¿se puede predecir cuántos nuevos positivos habrá mañana?". La respuesta es quizás sí, pero con técnicas computacionales más complejas como el Machine Learning, lo que intentaremos analizar en los próximos meses en conjunto con nuestros estudiantes de maestría en Sistemas de Información, mención en Data Science. (I)