6 / 11 / 2015

Una ‘app’ experimental de Facebook responde a preguntas de voz sobre fotos

Comparte este artículo

Una nueva app experimental desarrollada por los investigadores de Inteligencia Artificial de Facebook contesta a preguntas de voz sobre el contenido de fotos.

Yann LeCun, el director del grupo de AI de Facebook, presumió de la app, que algún día podría ayudar a los discapacitados visuales, en una ponencia en la conferencia EmTech de MIT Technology Review, la revista del MIT, en Cambridge (Massachusetts, EEUU).

LeCun mostró cómo la app respondía a una serie de preguntas sobre varias fotos. En una, un gato olisqueaba un gran racimo de plátanos poco maduros. La app contestó correctamente a preguntas por voz sobre si salía un gato en la foto, qué hacía, sobre dónde se encontraban los plátanos y sobre el color de los plátanos (verdes) y del gato (blanco y negro).

En otro ejemplo, un perro sujetaba un juguete en la boca. Cuando se le preguntó a qué jugaba el perro, la app contestó correctamente. "Al frisbee".

Históricamente, se ha trabajado en el área de imagen y en el de lenguaje por separado, señala la nota, pero combinarlos podría crear sistemas más capacitados para entender nuestro mundo y ayudarnos a gestionarlo.

El grupo de LeCun está sobre todo centrado en el uso de una técnica llamada aprendizaje profundo, que ha proporcionado grandes avances en la capacidad de las máquinas de entender el lenguaje natural y reconocer objetos en las imágenes. LeCun cree que pronto habilitará a los ordenadores para que entiendan muchos matices del lenguaje y sean capaces de mantener una conversación básica.

La app que lució LeCun este lunes está alimentada por un modelo de redes neuronales artificiales, llamado redes de memoria, que ya se han demostrado capaces de aprender el razonamiento verbal básico al leer unos sencillos cuentos.

Comparte este artículo
Suscríbete a nuestra Newsletter
Suscríbete