14 / 03 / 2016

Una tecnología alemana de análisis de texto elimina las ambigüedades

Comparte este artículo
University Saarland

Emblema de la Universidad del Sarre.

Científicos de Alemania han desarrollado una tecnología de búsqueda y análisis de cantidades muy grandes de textos de redes sociales y medios de comunicación en línea, que elimina ambigüedades de significado, y que está especialmente destinada a empresas que quieren conocer su reputación y la de sus productos.

Un equipo de la Universidad del Sarre (Alemania) ha desarrollado una nueva tecnología de análisis de textos que mejora considerablemente la búsqueda en colecciones de texto muy grandes por medio de la inteligencia artificial. Más allá de las búsquedas, esta tecnología también ayuda a investigar e incluso en la escritura de textos, proporcionando automáticamente información de contexto y sugiriendo enlaces a sitios web de interés.

Ambiverse, spin-off del Instituto Max Planck de Informática de Saarbrücken, presenta esta nueva tecnología durante la feria de tecnología CeBIT 2016, que se celebra en Hannover desde hoy y al hasta el viernes. En la era de los teléfonos inteligentes y las salas de chat, la información en las empresas no se distribuye a través de palabras habladas, sino más bien a través de correos electrónicos, bases de datos y portales de noticias internas.

"Para el análisis de los textos, nos basamos en conjuntos extremadamente grandes de conocimiento construidos a partir de fuentes de libre acceso como Wikipedia o grandes portales multimedia de la web. Estos conjuntos pueden crecer con conocimiento específico de la empresa o del ámbito de actuación, tales como catálogos de productos o correspondencia de los clientes", dice Johannes Hoffart, investigador del Instituto Max Planck de Informática y fundador de Ambiverse, en la nota de prensa de la Universidad del Sarre, de la que se hace eco Tendencias 21.

Ambigüedades

Mediante la aplicación de algoritmos complejos, estos textos son examinados y analizados con herramientas lingüísticas. "Nuestro software asigna entonces las empresas y áreas de negocio a las categorías correspondientes, lo cual nos permite reunir información valiosa sobre cómo de bien posicionados en el mercado están sus productos en comparación con los de los competidores", explica. Un reto especialmente difícil es el hecho de que los nombres de productos y empresas son de todo menos únicos y tienden a tener significados completamente diferentes en diferentes contextos, lo que los hace muy ambiguos.

"Nuestra tecnología ayuda a asignar palabras y frases a los objetos correctos del mundo real, resolviendo las ambigüedades de forma automática", explica el científico. París, por ejemplo, no solo representa la ciudad de la luz y la capital francesa, sino también una figura de la mitología griega o una conocida chica con antepasados ​​alemanes, siempre según el contexto.

"La búsqueda eficiente de enormes colecciones de texto sólo es posible si los diferentes significados de un nombre o un concepto están resueltos correctamente", dice Hoffart. El motor de búsqueda inteligente desarrollado por su equipo aprende de forma continua y mejora con el tiempo, y también asocia automáticamente nuevas entradas de texto a categorías similares. "Estos algoritmos son, por tanto, atractivos para las empresas que analizan las redes sociales o los medios de comunicación en línea para medir el grado de conocimiento de la marca de un producto o el éxito de una campaña de marketing", añade el investigador.

Comparte este artículo
Suscríbete a nuestra Newsletter
Suscríbete