Un estudio sobre ilusiones visuales en redes neuronales artificiales, en el que participa la Universitat de València, revela que la percepción artificial no elimina las subjetividades y los sesgos propios del cerebro humano. Que las máquinas pueden equivocarse en su percepción de la realidad, como lo hacen las personas, es una de las principales conclusiones de un trabajo recientemente publicado en la revista Vision Research.
Investigadores del Image Processing Laboratory (IPL) de la Universitat de València y del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la Universitat Pompeu Fabra (UPF) han demostrado que las redes neuronales de convolución (CNN) –un tipo de red neuronal artificial de uso común en sistemas de detección– también son afectadas por ilusiones visuales, tal y como ocurre en el cerebro humano.
En una red neuronal de convolución las neuronas se organizan en campos receptivos de forma muy similar a como lo hacen las neuronas en la corteza visual de un cerebro biológico. Hoy en día, las CNN se encuentran en gran variedad de sistemas autónomos, como por ejemplo en sistemas de detección y reconocimiento de caras o en vehículos de conducción automática.
El estudio publicado en Vision Research analiza el fenómeno de las ilusiones visuales en las redes de convolución en comparación con su efecto en la visión de los seres humanos. Tras entrenar CNN para tareas simples, como la eliminación de ruido o de desenfoque, los científicos han observado que dichas redes también son susceptibles de percibir la realidad de manera sesgada, a causa de ilusiones visuales de luminosidad y color.
Asimismo –dice el artículo–, “algunas ilusiones de redes pueden ser inconsistentes con la percepción de los humanos”. Esto significa que las ilusiones visuales que se dan en las CNN no han de coincidir necesariamente con las percepciones ilusorias biológicas, sino que en estas redes artificiales pueden producirse, además, ilusiones distintas y ajenas al cerebro humano. “Este es uno de los factores que nos lleva a pensar que no es posible establecer analogías entre la simple concatenación de redes neuronales artificiales y el cerebro humano, mucho más complejo”, señala Jesús Malo, catedrático de Óptica y Ciencias de la Visión e investigador en el Image Processing Laboratory de la Universitat de València.
Proponen un cambio de paradigma
En esta línea, el equipo acaba de publicar en Scientific Reports otro artículo que detalla los límites y las diferencias entre ambos sistemas, y cuyos resultados lleva a los autores a advertir sobre el uso de las CNN para estudiar la visión humana. “Las CNN están basadas en el comportamiento de las neuronas biológicas, en particular en su estructura básica formada por la concatenación de módulos compuestos por una operación lineal (sumas y productos) seguida de otra no lineal (saturación), pero esta formulación convencional es demasiado simple. Además de las limitaciones intrínsecas de dichas redes artificiales para modelar la visión, el comportamiento no lineal de las arquitecturas flexibles puede ser muy diferente al del sistema visual biológico”, resume Malo, cofirmante de los artículos por parte de la Universitat de València.
El texto argumenta el hecho de que las redes neuronales artificiales con módulos bio-inspirados intrínsecamente no-lineales, en lugar de las habituales concatenaciones excesivamente profundas de módulos lineal+no lineal, no solo emulan mejor la percepción humana básica, sino que pueden proporcionar un mayor rendimiento en aplicaciones de propósito general. “Nuestros resultados sugieren un cambio de paradigma tanto para la ciencia de la visión como para la inteligencia artificial”, concluye Jesús Malo.
Referencia 1
Alexander Gómez Vila, Adrián Martín, Javier Vázquez-Corral, Marcelo Bertalmío, Jesús Malo (2020), “Color illusions also deceive CNNs for low-level vision tasks: Analysis and Implications”, septiembre, Vision Research, edición avanzada online. DOI: https://doi.org/10.1016/j.visres.2020.07.010
Referencia 2
Marcelo Bertalmío, Alex Gómez-Villa, Adrián Martín, Javier Vázquez-Corral, David Kane, Jesús Malo (2020), “Evidence for the intrinsically nonlinear nature of receptive fields in vision”, Scientific Reports, 1 de octubre, 10, 16277. DOI: https://doi.org/10.1038/s41598-020-73113-0