El clasificador recopila licencias en cualquier idioma y permite la búsqueda de patentes similares evitando el plagio.
Un grupo de investigadores del
IIC (Instituto de Ingeniería del Conocimiento) ha desarrollado un clasificador de patentes resultado de un proyecto promovido por el Ministerio de Energía, Turismo y Agenda Digital que busca facilitar la búsqueda de licencias.
Durante seis meses el equipo de seis investigadores del IIC formado por los Directores de Ingeniería Algorítmica y del área de PLN (Procesamiento de Lenguaje natural), un arquitecto de Big Data, dos Data Scientist, y una lingüista computacional que coordinó el proyecto, ha trabajado en el diseño de la herramienta empleando algoritmos de clasificación de documentos y tecnologías de Procesamiento del Lenguaje Natural (PLN) gracias a los cuales las patentes escritas en cualquier idioma se pueden clasificar según el texto. La herramienta permite una búsqueda rápida entre todas las patentes. Igualmente, permite encontrar licencias similares lo que facilita la detección de plagios entre patentes y la localización de las ya registradas.
El clasificador funciona asignando etiquetas a las patentes gracias a un análisis de los datos con motores lingüísticos. El PLN actúa como un traductor online que analiza el texto. En esta parte, la herramienta propone una serie de tags y sugiere una serie de patentes similares basadas en el contenido a clasificar. Además, define el grado de seguridad de cada etiqueta, lo que permite revisar sólo aquellas en las que la herramienta tiene duda facilitando la labor y ahorrando tiempo.
La herramienta ha sido probada con 780.819 patentes americanas y 41.469 patentes españolas, y posee con una precisión muy elevada del 85% en el nivel 1. “Los resultados del clasificador confieren un alto grado de éxito y resulta una herramienta muy útil tanto para el Ministerio como para empresas especializadas en patentes” comenta Pablo Haya, director responsable del proyecto.
El clasificador de patentes fue puesto en marcha por el IIC a petición del Ministerio de Energía, Turismo y Agenda Digital a través de la SESIAD (Secretaría de Estado de la Sociedad De La Información y Agenda Digital) para la investigación de un sistema declasificación de solicitudes de patentes ante la cantidad de solicitudes de licencias que se reciben al año. Con este, el organismo firmó un contrato con el IIC para la investigación de un sistema de clasificación de solicitudes de patentes que ayude a agilizar este proceso.