7 / 03 / 2016

Un sistema de lenguaje natural responde con rapidez humana

Comparte este artículo
images of animals and birds

Imágenes que debía identificar Eve. Imagen: David DeVault. Fuente: USC.

David DeVault, profesor de investigación en la Universidad del Sur de California (USC, EE.UU.), está desarrollando sistemas de procesamiento de lenguaje de alta velocidad cuya velocidad y eficiencia pueden competir con las de los hablantes humanos en entornos específicos.

Resulta que uno de los desafíos clave en la creación de interfaces de voz más parecidas a la humana es la rapidez con la que los hablantes humanos entienden y se responden el uno al otro en una conversación en vivo.

"A pesar de que los altavoces humanos a menudo pueden comprender y responder lo que alguien está diciendo en una fracción de segundo, una interfaz de voz típica requerirá mucho más tiempo -a menudo uno o dos segundos- para tratar de entender lo que se ha dicho y responder de manera apropiada", dice DeVault, en una nota de prensa de la Fundación Nacional de Ciencia de EE.UU.

El ritmo relativamente lento de la interacción con las interfaces de voz actuales es una de las razones de que muchas personas sigan encontrándolas ineficientes y frustrantes de usar.

Con el apoyo de la Fundación Nacional de Ciencia, DeVault y sus estudiantes están analizando nuevas técnicas que pueden simplificar las conversaciones hombre-máquina al permitir que el sistema lleve a cabo todos los pasos de procesamiento informático necesarios en tiempo real, mientras el usuario está hablando. Los sistemas resultantes suelen ser capaces de averiguar lo que quiere decir el hablante y cómo responder bien, antes de que la persona termine de hablar.

El equipo describe en un trabajo reciente la creación y evaluación de una jugadora de alto rendimiento llamada Eve (Eva).

En el juego, los usuarios describen las imágenes que ven en la pantalla de su ordenador y la agente trata de adivinar cuál es la imagen de la que están hablando en ese momento tan rápido y con tanta precisión como le es posible. Mediante el uso de algoritmos de procesamiento de voz "incrementales" (palabra por palabra), la velocidad de comprensión y respuesta de la agente es tan rápida que su rendimiento en el juego está al nivel de la de los equipos humanos que compiten contra ella.

Comparte este artículo
Suscríbete a nuestra Newsletter
Suscríbete