Física i Intel·ligència Artificial per a avançar en la comprensió dels fenòmens climàtics i la Terra

19/02/2019

El machine learning i, en particular, el deep learning poden millorar la nostra comprensió sobre els fenòmens climàtics i el sistema Terra en general. No obstant això, aquestes tècniques de la Intel·ligència Artificial (IA) sovint troben solucions que són inconsistents amb lleis físiques, i que limiten el seu ús. Els científics proposen ara nous models híbrids que combinen IA i modelatge físic. Ho publiquen en Nature investigadors de la Universitat de València, el Max Planck Institute i el Lawrence Berkeley National Laboratory (USA).

En les últimes dècades els mètodes de machine learning –aprenentatge automàtic– han avançat enormement, i en l'actualitat s'ha passat d'una extracció de característiques de les dades d'una manera una mica rudimentària a algorismes basats en deep learning –aprenentatge profund– que extrauen la informació més rellevant de forma automàtica. L'impacte fonamental s'ha donat en aplicacions que involucren imatges, vídeo, veu i llenguatge natural. El seu ús no s'ha estés encara àmpliament al camp de les Ciències de la Terra, encara que ja existeixen aplicacions que ens permeten aprendre les distribucions de variables de la vegetació, per exemple, a escala local i global.

Recentment ha sigut possible abordar processos dinàmics utilitzant tècniques d'aprenentatge profund més sofisticades. Això permet, per exemple, quantificar la fotosíntesi global en la Terra considerant simultàniament les variacions estacionals i a curt termini.

La publicació incideix en la idea que el deep learning no s'ha aplicat extensament en les Ciències de la Terra, i planteja els reptes i les necessitats del camp per a fer-ho. Els models de machine learning poden en l'actualitat capturar processos físics molt complexos, com ara els huracans, els incendis o la dinàmica de la vegetació. El seu limitat ús es deu en part a possibles inconsistències i violacions de lleis físiques, per a la qual cosa es proposen nous models híbrids que combinen intel·ligència artificial i modelatge físic.

Deduir lleis físiques a partir d'observacions

“Actualment estem inundats per dades d'observació de la Terra, encara que en l'actualitat el camp de la intel·ligència artificial va retardat pel que fa a l'anàlisi i la interpretació,” explica Markus Reichstein, director del Max Planck Institute for Biogeochemistry en Jena (Alemanya), i primer autor de la publicació. Alguns exemples d'aplicació són la detecció d'esdeveniments extrems, com la propagació d'incendis o els huracans, que són processos molt complexos influenciats per les condicions locals, però també pel seu context temporal i espacial. Això també s'aplica al transport atmosfèric i oceànic, com el moviment del sòl i la dinàmica de la vegetació, temes clàssics de la ciència del sistema de la Terra.

Intel·ligència artificial per a millorar els models de clima i la comprensió del sistema terrestre

No obstant això, els enfocaments d'aprenentatge profund són complexos i sovint no respecten lleis físiques i prescripcions bàsiques. Tots els enfocaments estadístics basats en dades no garanteixen la coherència física per se, sinó que depenen en gran manera de la qualitat de les dades i experimenten dificultats amb les extrapolacions a dades no vistes. A més, el requisit per al processament de dades i la capacitat d'emmagatzematge són molt alts en l'actualitat, on s'estan adquirint petabytes diaris. La publicació analitza tots aquests requisits, desafiaments i obstacles, i desenvolupa una estratègia per a combinar de manera eficient l'aprenentatge automàtic amb el modelatge físic. Si ambdues tècniques s'uneixen, es creen els anomenats models híbrids. I poden usar-se, per exemple, per a modelar el moviment de l'aigua de l'oceà i predir, així, la temperatura de la superfície del mar. Mentre que les temperatures es modelen físicament, el moviment de l'aigua de l'oceà està representat per un enfocament d'aprenentatge automàtic. “La idea és combinar allò millor d’ambdòs mons –la consistència dels models físics amb la versatilitat de l'aprenentatge automàtic- per a obtindre models enormement millorats”, explica Markus Reichstein.

Gustau Camps-Valls, coordinador del grup de Processament d'Imatge i Senyal (ISP), del Laboratori de Processat d’Imatge (IPL) de la Universitat de València, al Parc Científic de la institució acadèmica, agrega: “L'aprenentatge automàtic juga un paper important en camps on les dades mostren fortes correlacions temporals o espacials, com ara en imatge, vídeo o processament de la parla: els algorismes aprenen aqueixa estructura molt bé i poden fer prediccions amb una precisió excel·lent”.

El problema es presenta de dues maneres: primer, molt sovint els models són tan complexos que es converteixen en una caixa negra i la interpretabilitat es veu compromesa; i segon, quan aquests models s'analitzen en profunditat, no respecten lleis fonamentals de la física, com per exemple la conservació de l'energia o la massa. En definitiva, han aprés a ajustar-se al que han vist, però no han extret cap llei fonamental. “Això últim és realment inquietant, i és la raó per la qual postulem que un aprenentatge automàtic guiat per les dades i que respecte la física del problema és el camí a seguir”, diu Camps-Valls. En certa manera, aquests models híbrids estan destinats a conciliar dues comunitats.

Els científics sostenen que la detecció i l’alerta precoç d'esdeveniments extrems, així com la predicció estacional a llarg termini i la projecció del clima es beneficiaran enormement dels enfocaments de deep learning i dels models híbrids discutits.

DL_perspective-2
 
 
 
 
 
 
 
Figura: Descomposición realizada por un algoritmo de «machine learning» de los datos de temperatura de la superficie oceánica durante 1871-2014. Los métodos actuales proporcionan los modos y distribuciones fundamentales en espacio, fase y tiempo, y permiten identificar patrones y sus dinámicas como la del fenómeno de El Niño. (© Bueso, Piles and Camps-Valls)

 

192975_web

 

Figura: Impacto del clima en el intercambio de carbono CO2: Los colores muestran las anomalías -radiación (rojo), temperatura (verde) y agua (azul)- en el intercambio de CO2 sobre la tierra durante los episodios del El Niño. Las prediciones de anomalías en agua, radiación y temperatura se obtuvieron mediante estimaciones realizadas con machine learning. (© Martin Jung)
 

Referència:

Deep learning and process understanding for data-driven Earth system science. Reichstein M., Camps-Valls G., Stevens B., Jung M., Denzler J. Cavalhais N., Prabhat (2019).
Nature 566, 195-204, doi: 10.1038/s41586-019-0912-1