29 / 07 / 2015

Agustín Gravano: “Usamos el lenguaje sin tener conciencia de su complejidad”

Comparte este artículo

Agustín Gravano, investigador del Departamento de Computación de la Universidad de Buenos Aires, estudia computacionalmente la extraordinaria y compleja coordinación que posee el hombre al hablar. Gravano es uno de los participantes en la International Joint Conference on Artificial Intelligence, que se celebra hasta el viernes en la capital argentina.

Gravano

Agustín Gravano. Fuente: Conicet.

Gravano explica en la web de Conicet (Consejo Nacional de Investigaciones Científicas y Técnicas de Argentina) que una de las muchas temáticas que pueden abordarse desde la IA es el habla, específicamente los sistemas que permiten la comunicación oral entre las computadoras y el hombre. “Dentro de todo lo que el ser humano puede hacer, está el manejo del lenguaje natural: inglés, español o suajili, cualquier lenguaje creado naturalmente en contraposición a los que el hombre diseñó para algo específico. Lo usamos espontáneamente sin tener conciencia de su complejidad porque fue desarrollándose con nosotros mismos y por eso nos resulta natural, pero llevar eso a una computadora es complejo. No hemos sido capaces todavía de lograr que manejen el lenguaje de manera razonable tanto para percibir como para producir mensajes aceptables”, dice.

Entender palabras o reconocer las intenciones, emociones, dobles sentidos o sutilezas son tareas muy sofisticadas para una máquina. A pesar de que existen algunas aplicaciones -especialmente para móviles- de reconocimiento de habla, su porcentaje de error es muy grande. Sólo es tolerable cuando se intenta acelerar el proceso de dictado de un mensaje o dar una instrucción, pero no si se pretende hablar o si se busca calidad sobre la percepción de lo que se dijo. Estos sistemas tienen un porcentaje de éxito que los hacen comercialmente viables pero aún hay mucho terreno por recorrer, señala.

El procesamiento de habla está en sus primeras etapas y aún falta no sólo comprender qué se dijo sino cómo. Ese “cómo” es conocido como prosodia, es decir, una rama de la lingüística que estudia los elementos fónicos una expresión como los acentos, los tonos y la entonación.

“Yo me sumé a una línea de investigación que empezó en los ‘90, hacemos estudios estadísticos para describir los mecanismos y herramientas que tiene el hombre para cambiar el significado sutil o drásticamente según cómo lo decimos. Usamos técnicas de machine learning (aprendizaje automático), que consiste en crear programas capaces de aprender comportamiento a base de ejemplos”.

El equipo trabaja con grabaciones de conversaciones, de las que se estudian atributos como el volumen o intensidad de voz. El objetivo es que el sistema pueda reconocer patrones que le indiquen diferentes modos de hablar, por ejemplo que detecte que si una persona dice una palabra en tono elevado y con mucha intensidad porque quiere poner énfasis en ella.

Finalmente, Gravano explica que este conocimiento puede ser utilizado por los desarrolladores de tecnologías: los que se dedican a hacer traductores automáticos, por ejemplo, o en call centers, donde la máquina podría inferir cuáles son las principales quejas y motivos para que luego fueran analizados por una persona.

Comparte este artículo
Suscríbete a nuestra Newsletter
Suscríbete