12 / 01 / 2016

Un algoritmo elimina ambigüedades en el registro de patentes estadounidense

Comparte este artículo
Nicholas Monath

Nicholas Monath. Fuente: UMassAmherst.

Investigadores de la Universidad de Massachusetts Amherst (EE.UU.) han desarrollado un algoritmo que facilitará las búsquedas en la base de datos en línea de las patentes estadounidenses, eliminando ambigüedades en el nombre de los inventores.

Un equipo de científicos de la computación de UMassAmherst se ha llevado el primer premio en un concurso internacional patrocinado por la Oficina de Patentes y Marcas y el Departamento de Comercio de Estados Unidos. Su algoritmo, informan en una nota de prensa, se incorporará a la nueva plataforma en línea de la Oficina, PatentsView.

El algoritmo se llama de "desambiguación de entidades", que significa diferenciar entre muchos individuos (entidades) con atributos similares y agruparlos correctamente, es decir, sin ambigüedad, dice Nicholas Monath, estudiante de posgrado en aprendizaje automático y procesamiento del lenguaje natural.

La desambiguación de inventores es importante porque a menudo aparecen en los registros de patentes con diferentes nombres, ortografía y apodos, o porque varios inventores pueden tener el mismo nombre.

Tales ambigüedades hacen las consultas de datos poco fiables, por lo que requieren intervención manual y mucho tiempo, explican los científicos. El concurso pidió a los participantes "eliminar la ambigüedad" de los inventores de más de 12 millones de patentes registradas entre 1976 y 2014. Dado el gran tamaño del conjunto de datos, la búsqueda manual no sería razonable.

Monath explica que su método "utiliza un enfoque jerárquico para la desambiguación, lo cual tiene varias ventajas respecto a los enfoques de pares alternativos. Nuestro método considera grupos de dos o más menciones en la determinación de la desambiguación".

Comparte este artículo
Suscríbete a nuestra Newsletter
Suscríbete