A pesar de la intervención de los servicios de emergencia, la supervivencia al alta es extremadamente baja, lo que impone la necesidad de desarrollar mecanismos capaces de predecir el PCEH de manera diaria y fiable. Dado que ya es conocido que su incidencia se ve afectada por las condiciones meteorológicas, ...
A pesar de la intervención de los servicios de emergencia, la supervivencia al alta es extremadamente baja, lo que impone la necesidad de desarrollar mecanismos capaces de predecir el PCEH de manera diaria y fiable. Dado que ya es conocido que su incidencia se ve afectada por las condiciones meteorológicas, el aprovechamiento de datos meteorológicos de alta resolución puede contribuir a establecer tal sistema predictivo. La identificación de asociaciones en datos caracterizados por su complejidad y volumen requiere técnicas capaces de integrar múltiples variables cuantitativas, como es el caso del Machine Learning (ML), la cual surge como alternativa a los enfoques estadísticos unidimensionales convencionales.
El análisis por ML de la combinación formada por la incidencia conocida del PCEH y la predicción meteorológica diaria puede generar un sistema de alerta temprana para individuos de alto riesgo, materializado como dispositivo conectado al internet de las cosas.
Diseño del estudio
Considerando los datos del registro nacional japonés de emergencias durante diez años y los proporcionados por una filial de IBM especializada en predicciones meteorológicas a una resolución de 30 km, se generaron los conjuntos de datos destinados tanto al entrenamiento como al testado del algoritmo de ML. Las variables meteorológicas incluyeron la temperatura ambiente, presión atmosférica, humedad relativa, precipitación durante las horas previas, nieve, nubosidad y velocidad del viento, mientras que las variables cronológicas estuvieron formadas por las estaciones, días de la semana y el período vacacional propio de Japón.
Para el desarrollo del modelo predictivo de incidencia diaria del PCEH, se utilizó el algoritmo eXtreme Gradient Boosting, usado frecuentemente en la resolución de problemas mediante ML, con hiperparámetros seleccionados para maximizar la capacidad predictiva mediante validación cruzada cuádruple. Esta última clasifica los datos en cuatro grupos, utilizando uno de ellos en la validación y repitiendo el proceso un total de cuatro veces en las cuales el grupo de validación es distinto. La fiabilidad del modelo obtenido está basada en la media de error absoluto (MAE) y en la media del porcentaje de error absoluto (MAPE) entre la predicción de incidencia y la incidencia real, considerándose que valores de MAPE inferiores a 10% reflejan una elevada fiabilidad.
La contribución relativa de cada variable meteorológica a la predicción de PCEH fue evaluada de manera separada mediante otro algoritmo.
Predicción altamente precisa
Aunque el modelo desarrollado mostró fiabilidad en la predicción de PCEH basada, o bien en datos meteorológicos, o bien en datos cronológicos, la combinación de ambos tipos de datos mejoró significativamente el poder predictivo, el cual alcanzó valores de MAPE de 7 y 7,78% en los conjuntos de entrenamiento y testado, respectivamente.
También la correlación entre los valores observados y los predichos fue mayor, con valores próximos al 88% en ambos conjuntos. La fiabilidad del modelo quedó representada en la predicción de incidencia de PCEH en la ciudad de Kobe en la semana del 28 de enero al 3 de febrero de 2018, en la que se dieron 27 casos y se predijeron 24. La predicción fue también correcta en cuatro de los nueve distritos de la ciudad. En el ámbito de las variables meteorológicas, la que mayor asociación mostró con la incidencia de PCEH fue una temperatura ambiente inferior a la media.
Las diferencias mayores con la temperatura media del día anterior, así como entre las temperaturas mínima y máxima del mismo día, también mostraron ser más importantes en la predicción que otras variables de esta categoría. En cuanto a las variables cronológicas, los días domingo y lunes, el invierno y un principio de año más reciente fueron las que mayor asociación mostraron.
Para más información, descargar el PDF adjunto.