Física e Inteligencia Artificial para avanzar en la comprensión de los fenómenos climáticos y la Tierra

19/02/2019

El machine learning y, en particular, el deep learning pueden mejorar nuestra comprensión sobre los fenómenos climáticos y el sistema Tierra en general. Sin embargo, estas técnicas de la Inteligencia Artificial (IA) a menudo encuentran soluciones que son inconsistentes con leyes físicas, y que limitan su uso. Los científicos proponen ahora nuevos modelos híbridos que combinen IA y modelado físico. Lo publican en Nature investigadores de la Universitat de València, el Max Planck Institute y el Lawrence Berkeley National Laboratory (USA).

En las últimas décadas los métodos de machine learning –aprendizaje automático– han avanzado enormemente, y en la actualidad se ha pasado de una extracción de características de los datos de una manera un tanto rudimentaria a algoritmos basados en deep learning –aprendizaje profundo– que extraen la información más relevante de forma automática. El impacto fundamental se ha dado en aplicaciones que involucran imágenes, video, voz y lenguaje natural. Su uso no se ha extendido todavía ampliamente al campo de las Ciencias de la Tierra, aunque ya existen aplicaciones que nos permiten aprender las distribuciones de variables de la vegetación, por ejemplo, a escala local y global.

Recientemente ha sido posible abordar procesos dinámicos utilizando técnicas de aprendizaje profundo más sofisticadas. Esto permite, por ejemplo, cuantificar la fotosíntesis global en la Tierra considerando simultáneamente las variaciones estacionales y a corto plazo.

La publicación incide en la idea de que el deep learning no se ha aplicado extensamente en las Ciencias de la Tierra, y plantea los retos y necesidades del campo para hacerlo. Los modelos de machine learning pueden en la actualidad capturar procesos físicos muy complejos como los huracanes, incendios o la dinámica de la vegetación. Su limitado uso se debe en parte a posibles inconsistencias y violaciones de leyes físicas, para lo cual se proponen nuevos modelos híbridos que combinen inteligencia artificial y modelado físico.

Deducir leyes físicas a partir de observaciones

“Actualmente estamos inundados por datos de observación de la Tierra, aunque en la actualidad el campo de la inteligencia artificial va retrasado en lo que hace referencia al análisis e interpretación,” explica Markus Reichstein, director del Max Planck Institute for Biogeochemistry en Jena (Alemania), y primer autor de la publicación. Algunos ejemplos de aplicación son la detección de eventos extremos, como la propagación de incendios o los huracanes, que son procesos muy complejos influenciados por las condiciones locales, pero también por su contexto temporal y espacial. Esto también se aplica al transporte atmosférico y oceánico, como el movimiento del suelo y la dinámica de la vegetación, algunos de los temas clásicos de la ciencia del sistema de la Tierra.

Inteligencia artificial para mejorar los modelos de clima y la comprensión del sistema terrestre

Sin embargo, los enfoques de aprendizaje profundo son complejos y a menudo no respetan leyes físicas y prescripciones básicas. Todos los enfoques estadísticos basados en datos no garantizan la coherencia física per se, sino que dependen en gran medida de la calidad de los datos y experimentan dificultades con las extrapolaciones a datos no vistos. Además, el requisito para el procesamiento de datos y la capacidad de almacenamiento son muy altos en la actualidad, donde se están adquiriendo petabytes diarios. La publicación analiza todos estos requisitos, desafíos y obstáculos, y desarrolla una estrategia para combinar de manera eficiente el aprendizaje automático con el modelado físico. Si ambas técnicas se juntan, se crean los llamados modelos híbridos. Por ejemplo, pueden usarse para modelar el movimiento del agua del océano para predecir la temperatura de la superficie del mar. Mientras que las temperaturas se modelan físicamente, el movimiento del agua del océano está representado por un enfoque de aprendizaje automático. “La idea es combinar lo mejor de dos mundos –la consistencia de los modelos físicos con la versatilidad del aprendizaje automático– para obtener modelos enormemente mejorados”, explica Markus Reichstein.

Gustau Camps-Valls, coordinador del grupo de Procesamiento de Imagen y Señal (ISP), del Laboratorio de Procesado de Imágenes (IPL) de la Universitat de València, en el Parc Científic de la institución académica, agrega: “El aprendizaje automático juega un papel importante en campos donde los datos muestran fuertes correlaciones temporales o espaciales, como en imagen, video o procesamiento del habla: los algoritmos aprenden esa estructura muy bien y pueden hacer predicciones con una precisión sobresaliente”.

El problema se presenta de dos maneras: primero, muy a menudo los modelos son tan complejos que se convierten en una caja negra y la interpretabilidad se ve comprometida; y segundo, cuando estos modelos se analizan en profundidad, no respetan las leyes fundamentales de la física, como por ejemplo la conservación de la energía o la masa. En definitiva, han aprendido a ajustarse a lo que han visto, pero no han extraído ninguna ley fundamental. “Esto último es realmente desazonador, y la razón por la que postulamos que un aprendizaje automático guiado por los datos y que respete la física del problema es el camino a seguir”, dice Camps-Valls. En cierto modo, estos modelos híbridos están destinados a conciliar dos comunidades.

Los científicos sostienen que la detección y alerta temprana de eventos extremos, así como la predicción estacional a largo plazo y la proyección del clima se beneficiarán enormemente de los enfoques de deep learning y de los modelos híbridos discutidos.

 

Figura: Descomposición realizada por un algoritmo de «machine learning» de los datos de temperatura de la superficie oceánica durante 1871-2014. Los métodos actuales proporcionan los modos y distribuciones fundamentales en espacio, fase y tiempo, y permiten identificar patrones y sus dinámicas como la del fenómeno de El Niño. (© Bueso, Piles and Camps-Valls)

Figura: Descomposición realizada por un algoritmo de «machine learning» de los datos de temperatura de la superficie oceánica durante 1871-2014. Los métodos actuales proporcionan los modos y distribuciones fundamentales en espacio, fase y tiempo, y permiten identificar patrones y sus dinámicas como la del fenómeno de El Niño. (© Bueso, Piles and Camps-Valls)

 

 

 

 

 

192975_web

 
 
Figura: Impacto del clima en el intercambio de carbono CO2: Los colores muestran las anomalías -radiación (rojo), temperatura (verde) y agua (azul)- en el intercambio de CO2 sobre la tierra durante los episodios del El Niño. Las prediciones de anomalías en agua, radiación y temperatura se obtuvieron mediante estimaciones realizadas con machine learning. (© Martin Jung)

 

 

Referencia: Deep learning and process understanding for data-driven Earth system science. Reichstein M., Camps-Valls G., Stevens B., Jung M., Denzler J. Cavalhais N., Prabhat (2019).
Nature 566, 195-204, doi: 10.1038/s41586-019-0912-1