![La máquina que a golpe de click revela datos ocultos de la Segunda Guerra Mundial](https://s3.ppllstatics.com/lasprovincias/www/multimedia/2023/09/11/transkriptorium-RdZT6Y3NY9vHSZ1rwsSMwCJ-1200x840@Las%20Provincias.jpg)
![La máquina que a golpe de click revela datos ocultos de la Segunda Guerra Mundial](https://s3.ppllstatics.com/lasprovincias/www/multimedia/2023/09/11/transkriptorium-RdZT6Y3NY9vHSZ1rwsSMwCJ-1200x840@Las%20Provincias.jpg)
Secciones
Servicios
Destacamos
Imagina tener a tu alcance, a sólo un golpe de click, toda la información que se guarda en el archivo de Simancas, una de las fuentes históricas de la Historia de la Humanidad. O, por ejemplo, descubrir el pasado de una víctima de los campos de concentración nazi de la Segunda Guerra Mundial. O, por qué no, saber qué fue de un personaje histórico en una etapa concreta de su vida sobre la que apenas se tienen registros o bien los que hay son inaccesibles.
Tampoco hace falta irse al pasado. Imagina que simplemente necesitas una documentación concreta de un tío abuelo del pueblo que te ha dejado una herencia que no esperabas y sobre la que apenas tienes información porque se extravió. O que tengas acceso a toda la información que la Administración tiene sobre ti. Pues ahora estás más cerca de tener acceso a esta información (siempre que la ley de protección de datos lo permita, claro).
No, no es digitalización. O, al menos, no sólo digitalización. Y, sí, la Inteligencia Artificial juega un papel importante. Pero también la paleografía y la investigación histórica. Todo esto se conjuga en una tecnología pionera desarrollada en el seno de la Universidad Politécnica de Valencia. Más en concreto, impulsada por la empresa valenciana TransKriptorium, una spin-off que surgió en 2020 del Centro de Investigación Pattern Recognition and Human Language Technologies (PRHLT). En sólo tres años, esta startup ya cuenta con varios clientes en su cartera y negocia varios proyectos con diferentes administraciones.
Noticia Relacionada
Uno de los proyectos más destacados es el que tiene con Cruz Roja Internacional, en Ginebra. «Ya hemos hecho un primer proyecto para la búsqueda de información de todos los prisioneros en campos de concentración nazis. Hemos hecho ya la entrega de la prueba piloto», explica Morró, que destaca la confidencialidad exigida en estos tratamientos. «Nosotros firmamos con todas las instituciones una carta de confidencialidad para que nunca pongamos en disposición de nadie estos datos que manejamos. En este caso, recibimos las fichas de prisioneros que nos manda Cruz Roja para clasificarlo y hacerlo gestionable. Esto a nivel humano tardaríamos 30 años, pero con nuestro software tardamos sólo entre cinco y seis meses», asegura.
En concreto, el resultado de este proyecto es que se pueda saber en qué campo de concentración entró cada persona, en qué día, cómo fue clasificado, lo que sufrió y lo que vivió esa persona cuando estuvo bajo control nazi. «Nunca se ha hecho nada así», insiste el CEO de la firma valenciana. «Hemos encontrado muchísimos personajes históricos cuando hemos trabajado diversas colecciones», añade.
De la idea a la empresa
Luis Antonio Morró se enamoró al instante de la idea que le propusieron unos investigadores de la UPV especializados en el entrenamiento de Inteligencia Artificial. «Desde el primer momento en el que me contaron el proyecto me quedé impresionado. Ver esa capacidad de transcribir textos manuscritos de cualquier época e idioma, cualquier documento, y llevarlo a una base de datos gestionables y navegables me pareció increíble», cuenta a LAS PROVINCIAS el que ahora es CEO de TransKriptorium.
Y es que, fueron los propios investigadores los que acudieron a Morró para convertir su idea en una empresa. «Tenían desarrollada una tecnología super disruptiva pero que sin embargo no sabían cómo llevar al mundo empresarial. Es lógico, los investigadores se dedican a investigar, que es lo suyo, por lo que necesitaban a alguien del mundo de la empresa. Cuando me ofrecieron montar la spin off, yo estaba en ese momento trabajando como consultor de estrategia para empresas de primera línea del Ibex-35, pero como me pilló en la pandemia estaba todo paralizado», relata.
Noticia Relacionada
Lourdes Martí
Primero, Morró analizó la madurez y el estado en el que se encontraba la tecnología y cómo de receptivo estaba el mercado para pagar por el producto. Fue en diciembre de ese mismo año, en 2020, cuando TransKriptorium aterrizó en forma de mercantil. Según explica, la clave es arrancar la empresa cuanod ya hay clientes asegurados que permitan garantizar la solvencia de la actividad. «Muchas de las spin off acaban siendo zombies. Se cae en el error de mandar a los investigadores a un curso de emprendimiento que dura semanas y luego los lanzan al mundo empresarial, metiéndolos en un problema porque al no conseguir una transferencia real al mercado, se ven obligados a dejar de investigar para centrarse en la supervivencia de la empresa», reflexiona.
En diciembre de 2020, TransKriptorium ya estaba trabajando para NTT-Data, una multinacional japonesa y para Inetum, una de las compañías más potentes en el ámbito del servicio digital. «Teníamos ya muchos clientes del ámbito de la universidad que querían trabajar con nosotros. Esto permitió que la empresa arrancara y que no les costara dinero de su bolsillo a los investigadores. Ellos tienen el 80% de la sociedad en su propiedad y son miembros del Consejo de Administración», explica Morró.
Pero...¿cómo funciona su tecnología?
Morró llama «la máquina» al software que han desarrollado. Según explica, ellos reciben los documentos digitalizados, en formato imagen o foto, y los introduce en el sistema, que en apenas dos meses puede interpretar y clasificar una colección de millones de páginas, haciéndolas fácilmente accesibles y navegables. «Una vez tenemos los documentos, hacemos una análisis sobre los idiomas, el tipo de letra, la distribución y estructura del documento (si está a una columna o más, si tiene imágenes insertadas…)», cuenta.
«Después hacemos una transcripción. Es decir, le enseñamos a la máquina a leer este documento; le decimos esto es la palabra casa, por ejemplo. Luego, el sistema empieza a conceptualizar; entiende que en una receta de tortilla de patatas, las palabras clave van a ser patata y huevo. Luego, racionaliza las búsquedas. Después de enseñarle a leer, cogemos toda la colección y la pasamos por nuestra tecnología. A partir de ese momento tienes ya una base de datos con la que los clientes pueden hacer búsquedas, estadísticas y cualquier tipo de análisis 'big data'», cuenta el CEO de esta firma valenciana, que asegura contar con «una tecnología pionera y única en el mundo».
Esta tecnología recibe el nombre de Indexación Probabilística (PrIx), que consiste en la posibilidad de encontrar aproximaciones sobre conceptos y palabras que no aparecen escritas pero deberían estar por el contexto. «Por ejemplo, en el documento se busca la palabra patata y la máquina no la reconoce, pero va a buscar las que se parezcan porque a lo mejor la persona que escribió el texto se equivocó o el escrito se ha emborronado o escribió una abreviatura…», indica.
Otros proyectos
Son varios los proyectos que tiene entre manos esta spin off. Además de trabajar colecciones históricas como el archivo de Simancas o de la Corona del Reino de Aragón, han analizado y «metadatado» colecciones del siglo quince en adelante. «Muchas de estas colecciones son súper complejas de conseguir y entender porque se tratan de escrituras difíciles que sólo los paleógrafos pueden entenderla», señala Morró, que pone en valor el trabajo de los paleógrafos, que juegan un papel fundamental en TransKriptorium. «Nosotros hemos convertido en bases de datos entendibles y accesibles todos esos documentos. Antes había que buscar PDF por PDF y leerlo todo. Ahora puedes navegar por esos documentos como lo haces por internet», agrega.
Otros proyectos interesante lo está realizando con la Administración y se trata de establecer un sistema predictivo de los ciclos de lluvia y sequía. «Hay datos manuscritos en tablas de hace 150 años. Con nuestra tecnología los sacamos, los grabamos con Inteligencia Artificial y generamos modelos predictivos», explica Morró, que incide en que se trata de una herramienta «revolucionaria» y transversal que se puede aplicar a cualquier información histórica, cultural, médica, meteorológica, notarial y demás campos posibles.
Publicidad
Publicidad
Te puede interesar
Publicidad
Publicidad
Esta funcionalidad es exclusiva para suscriptores.
Reporta un error en esta noticia
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.