Big Data
Innovación
Herramienta

Investigadores del IIC despliegan un clasificador de patentes basado en 'big data'

Esta nueva herramienta, puesta en marcha a petición del Ministerio de Energía, Turismo y Agenda Digital a través de la SESIAD, recopila licencias en cualquier idioma y permite la búsqueda de patentes similares evitando el plagio.

big data mundo

Un grupo de investigadores del IIC (Instituto de Ingeniería del Conocimiento) - formado por los directores de Ingeniería Algorítmica y del área de PLN, un arquitecto de big data, dos data scientist, y una lingüista computacional- ha desarrollado durante seis meses un clasificador de patentes.

Este proyecto fue puesto en marcha por el IIC a petición del Ministerio de Energía, Turismo y Agenda Digital a través de la SESIAD (Secretaría de Estado de la Sociedad De La Información y Agenda Digital) para la investigación de un sistema de clasificación de solicitudes de patentes ante la cantidad de solicitudes de licencias que se reciben al año. En esta línea, el organismo firmó un contrato con el IIC para agilizar el proceso.

Se trata del diseño de una herramienta empleando algoritmos de clasificación de documentos y tecnologías de Procesamiento del Lenguaje Natural (PLN) gracias a los cuales las patentes escritas en cualquier idioma se pueden clasificar según el texto. Además, la herramienta permite una búsqueda rápida entre todas las patentes, y permite encontrar licencias similares lo que facilita la detección de plagios entre patentes y la localización de las ya registradas.

El clasificador funciona asignando etiquetas a las patentes gracias a un análisis de los datos con motores lingüísticos. El PLN actúa como un traductor online que analiza el texto. En esta parte, la herramienta propone una serie de tags y sugiere una serie de patentes similares basadas en el contenido a clasificar. Además, define el grado de seguridad de cada etiqueta, lo que permite revisar sólo aquellas en las que la herramienta tiene duda facilitando la labor y ahorrando tiempo.

La herramienta ha sido probada con 780.819 patentes americanas y 41.469 patentes españolas, y posee con una precisión muy elevada del 85% en el nivel 1. “Los resultados del clasificador confieren un alto grado de éxito y resulta una herramienta muy útil tanto para el Ministerio como para empresas especializadas en patentes” comenta Pablo Haya, director responsable del proyecto.  



Contenido Patrocinado

Fernando Rubio Román, CTO de Microsoft España. TECNOLOGÍA
Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital