La Intel·ligència Artificial també té percepcions il·lusòries

16/10/2020

Un estudi sobre il·lusions visuals en xarxes neuronals artificials, en el qual participa la Universitat de València, revela que la percepció artificial no elimina les subjectivitats i els biaixos propis del cervell humà. Que les màquines poden equivocar-se en la seua percepció de la realitat, com ho fan les persones, és una de les principals conclusions d’un treball recentment publicat a la revista Vision Research.

Investigadors de l’Image Processing Laboratory (IPL) de la Universitat de València i del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la Universitat Pompeu Fabra (UPF) han demostrat que les xarxes neuronals de convolució (CNN) –un tipus de xarxa neuronal artificial d’ús comú en sistemes de detecció– també són afectades per il·lusions visuals, tal com ocorre en el cervell humà.

En una xarxa neuronal de convolució les neurones s’organitzen en camps receptius de manera molt similar a com ho fan les neurones a l’escorça visual d’un cervell biològic. Avui en dia, les CNN es troben en gran varietat de sistemes autònoms, com per exemple en sistemes de detecció i reconeixement de cares o en vehicles de conducció automàtica.

L’estudi publicat a Vision Research analitza el fenomen de les il·lusions visuals en les xarxes de convolució en comparació del seu efecte en la visió dels éssers humans. Després d’entrenar CNN per a tasques simples, com l’eliminació de soroll o de desenfocament, els científics han observat que aquestes xarxes també són susceptibles de percebre la realitat de manera esbiaixada, a causa d’il·lusions visuals de lluminositat i color.

Així mateix –diu l’article–, “algunes il·lusions de xarxes poden ser inconsistents amb la percepció dels humans”. Això vol dir que les il·lusions visuals que es donen en les CNN no han de coincidir necessàriament amb les percepcions il·lusòries biològiques, sinó que en aquestes xarxes artificials poden produir-se, a més, il·lusions diferents i alienes a el cervell humà. “Aquest és un dels factors que ens porta a pensar que no és possible establir analogies entre la simple concatenació de xarxes neuronals artificials i el cervell humà, molt més complex”, assenyala Jesús Malo, catedràtic d’Òptica i Ciències de la Visió i investigador a l’Image Processing Laboratory de la Universitat de València.

Proposen un canvi de paradigma

En aquesta línia, l’equip acaba de publicar a Scientific Reports un altre article que detalla els límits i les diferències entre els dos sistemes, i els resultats dels quals porten els autors a advertir sobre l’ús de les CNN per estudiar la visió humana. “Les CNN estan basades en el comportament de les neurones biològiques, en particular en la seua estructura bàsica formada per la concatenació de mòduls formats per una operació lineal (sumes i productes) seguida d’una altra no lineal (saturació), però aquesta formulació convencional és massa simple. A més de les limitacions intrínseques d’aquestes xarxes artificials per modelar la visió, el comportament no lineal de les arquitectures flexibles pot ser molt diferent del del sistema visual biològic”, resumeix Malo, cofirmant dels articles per part de la Universitat de València.

El text argumenta el fet que les xarxes neuronals artificials amb mòduls bioinspirats intrínsecament no-lineals, en lloc de les habituals concatenacions excessivament profundes de mòduls lineal+no lineal, no només emulen millor la percepció humana bàsica, sinó que poden proporcionar un major rendiment en aplicacions de propòsit general. “Els nostres resultats suggereixen un canvi de paradigma tant per a la ciència de la visió com per a la intel·ligència artificial”, conclou Jesús Malo.

Referència 1

Alexander Gómez Vila, Adrián Martín, Javier Vázquez-Corral, Marcelo Bertalmío, Jesús Malo (2020), “Color illusions also deceive CNNs for low-level vision tasks: Analysis and Implications”, setembre, Vision Research, edició avançada en línia. DOI: https://doi.org/10.1016/j.visres.2020.07.010

Referència 2

Marcelo Bertalmío, Alex Gómez-Villa, Adrián Martín, Javier Vázquez-Corral, David Kane, Jesús Malo (2020), “Evidence for the intrinsically nonlinear nature of receptive fields in vision”, Scientific Reports, 1 d’octubre, 10, 16277. DOI: https://doi.org/10.1038/s41598-020-73113-0