El avance
enriquece la ciencia del conocimiento y la visión de los robots.
JAVIER SAMPEDRO
¿Hay una
gramática del reconocimiento facial?
Los estudios de
psicología experimental y de visión artificial han usado hasta ahora seis
gestos: felicidad, sorpresa, enfado, tristeza, miedo y asco (alguno lo quiso
dejar en cuatro, asociando asco y miedo por un lado y felicidad y sorpresa por
otro). El nuevo trabajo de la Universidad de Ohio lo expande a 21 expresiones
faciales descifrando una especie de gramática de la expresión facial, con
categorías compuestas como felizmente sorprendido, o tristemente temeroso.
Tras analizar la cara
de 230 individuos en todas esas tesituras, concluyen que cada una implica una
combinación distinta de los músculos de la cara, y que los sistemas de visión
artificial (FACS, facial action coding system) reconocen las siete expresiones
básicas con 97% de precisión, y las expresiones compuestas con el 77%. Los
resultados son importantes para la investigación del conocimiento humano, o
cognitiva, la neurología y los sistemas de visión artificial, incluidas las
prótesis para ciegos (y para que los robots interpreten los gestos de sus
interlocutores humanos, o los reproduzcan).
“Nuestro trabajo introduce un tipo importante de categorías emocionales,
llamado emociones compuestas”, dice Aleix Martínez, coautor del estudio y
científico cognitivo de los departamentos de Ingeniería de Computación y
Ciencias del Cerebro de la Universidad Estatal de Ohio en Columbus. Estas
categorías compuestas están formadas por la combinación de dos o más categorías
básicas —o cardinales— de respuestas emocionales.
Por ejemplo, la consternación puede entenderse como el sentimiento de asco
combinado con el de indignación, y así lo demuestran los experimentos de
Martínez y sus colegas: los indicadores faciales de la consternación —como la
apertura de los párpados o la curvatura de la boca— son, en afecto, una
combinación de los gestos del asco y el enfado. El odio es una combinación de
los mismos dos componentes, aunque esta vez con el énfasis puesto más en el
enfado que en la repugnancia.
Los anteriores son casos en que una sola palabra abarca la combinación de dos
emociones básicas (o cardinales). Las más de las veces, el gesto combinado (o
la emoción compuesta) requiere combinar también las palabras que designan a las
emociones elementales: felizmente sorprendido, tristemente sorprendido,
asqueadamente sorprendido, tristemente atemorizado, tristemente enfadado y así
hasta las 15 emociones compuestas que, a partir de ahora, tendrán que usar los
estudios cognitivos, los psicólogos y los robots.
Felicidad, sorpresa,
enfado, tristeza, miedo y asco son las bases expresivas
“Los resultados”, dice
Martínez, “indican que el repertorio de expresiones faciales que usan
típicamente los humanos se describe mejor como un conjunto rico de categorías
básicas y compuestas que en la forma de un pequeño grupo de elementos básicos”.
Hay una ley no escrita de la ciencia que se llama la navaja de Ockham. Aunque
su formulación original por el monje franciscano Guillermo de Ockham, una de
las cúspides del pensamiento medieval, resulta en extremo espesa y farragosa,
no puede negarse a su concepto central una claridad de una índole casi brutal:
a igualdad de todo lo demás, la explicación más simple suele ser la correcta.
Pero el reconocimiento de las caras parece contradecir ese principio, pues no
se puede reducir al menor posible sistema de números primos emocionales
—felicidad, sorpresa, enfado, tristeza, miedo y asco—, sino que requiere añadir
a esa tabla periódica de los sentimientos toda una serie de emociones
complejas.
Pero hay un sentido en que 21 puede ser más simple que 6: si los 21 gestos
faciales complejos son meras combinaciones —o mejor aún, combinaciones
gramaticales— de los seis gestos simples que se han utilizado tradicionalmente,
tal vez todo nuestro reconocimiento cerebral de las emociones —o, al menos de
las emociones faciales— pueda reducirse a un pequeño grupo de números primos de
la expresión facial, un acervo básico cuyas combinaciones den lugar a un
caleidoscopio de ademanes, guiños y muecas que virtualmente lo expresen todo.
Al igual que un alfabeto de solo una treintena de signos puede generar un
lenguaje entero, y el lenguaje una literatura y las literaturas una historia de
la literatura.
Entonces, ¿hay una gramática del reconocimiento facial? ¿Puede uno combinar
asco y enfado para producir odio de un modo similar a como uno combina un
nombre y un verbo para generar una frase que a su vez puede comportarse como
una nueva unidad gramatical?
La Mona Lisa expresa
una cosa con los ojos y otra con la boca
“Nuestros resultados
muestran que el odio se produce y se reconoce como una categoría emocional
independiente del enfado y el asco”, responde a este diario el líder de la
investigación, el catalán Aleix Martínez. “También muestran que tanto el enfado
como el asco resultan claramente visibles en la expresión facial del odio; y
aunque sabemos ahora que esas categorías emocionales están representadas en el
cerebro, seguimos sin saber cómo se codifican ahí”.
Esa laguna del conocimiento es una de las que la investigación actual está
tratando de resolver. “Los resultados preliminares”, dice el investigador
español, “parecen indicar que algunas categorías emocionales se codifican en el
cerebro como objetos independientes, mientras que otras se pueden interpretar
como elementos más básicos”. Visto lo cual, el reconocimiento facial puede
considerarse una gramática en algunos aspectos, pero no en todos. En cualquier
caso, esto es algo que seguramente puede achacarse también a la gramática
propiamente dicha, la de los nombres, los verbos y las oraciones compuestas.
Los elementos del reconocimiento de la emoción facial no son nombres y verbos,
sino parámetros como la forma de los labios y el grado de apertura de los ojos.
¿Cabe preguntarse entonces cuán lejos estamos de explicar científicamente la
enigmática sonrisa de la Mona Lisa? Responde Martínez:
“La Mona Lisa está expresando una emoción feliz en la zona de la boca, pero no
con los ojos; una sonrisa naturalista —o una sonrisa de Duchenne, como la
llaman los científicos cognitivos en referencia al estudioso del siglo XIX—
implica la contracción de un grupo de músculos que arruga la comisura de los
ojos, como al entrecerrarlos; también hay que decir que la expresión de la Mona
Lisa es muy asimétrica. La mitad derecha de la imagen (la mitad izquierda de
ella) está claramente feliz, no así la mitad izquierda (la derecha de ella)”.
“Las expresiones faciales naturalistas, y las que se ponen al posar para la
ocasión afectando alegría, se enfatizan en el otro lado, y esto crea una
extraña asimetría que no estamos acostumbrados a ver”.
Martínez estudió en la Universidad Autónoma de Barcelona, y se especializó en
París y Purdue (EE UU). Se formó en ingeniería informática y se fue interesando
progresivamente en ciencias cognitivas. “En las ciencias cognitivas asumimos
que el cerebro es un ordenador”, dice, “y nuestra tarea es decodificar los
algoritmos que el cerebro usa en las tareas diarias”.
Percibir si alguien se siente bien o mal.. es tal vez el principal de todos
ellos.
Orientar, expandiendo Conciencias ♡.✿•°`*
Las imágenes y fotos
que ilustran la nota, las he encontrado en la web. (Internet). Si alguna
es tuya y deseas que la retire, házmelo saber y si la deseas compartir, estaré
encantada de darte el crédito. Gracias ♡