La inteligencia artificial y big data se acercan a la literatura para aplicar metodologías computacionales que permiten descifrar la creación literaria, a través del análisis de patrones y arquitectura de los versos, y descubrir autorías ocultas tras los pseudónimos de ciertas obras.
La UNED colabora con otras doce instituciones en el proyecto Computational Literary Studies Infraestructure (CLS Infra) para experimentar nuevas formas de investigar el ámbito literario con herramientas digitales. El proyecto, dotado con cinco millones de euros,  construirá durante cuatro años un puente para compartir recursos y datos de alta calidad que arrojen algo de luz a siglos de creación literaria.

Salvador Ros, Director del LINHD, es uno de los investigadores de la UNED implicados en el CLS Infra. Su misión es desarrollar,  junto a otros investigadores de la UNED como Víctor Fresno, José Luis Fernández Vindel o Elena González Blanco, una infraestructura que construya piezas de software y aplique las herramientas digitales para investigar la información oculta tras la poesía y otros géneros literarios. Así, según Salvador Ros “el algoritmo desarrollado en los poemas sirve para identificar el tipo de rima, la cantidad de versos, identificar personajes, patrones de estilo, percepciones o sentimientos”. Además, la estilometría o técnica que se basa en la frecuencia de las palabras, ha permitido identificar la autoría real de ciertos textos y reconocer autores ocultos tras pseudónimos como Elena Ferrante o J.K.Rowling. Descubriendo que ésta última, autora de la saga de Harry Potter, había escrito dos libros anteriores bajo pseudónimo.

Estas investigaciones denominadas Análisis de autoría suponen un gran avance al favorecer a la literatura escrita por mujeres, sacando a la luz figuras ocultadas o relegadas a la figura masculina.

El reto más importante para Ros es el semántico, ya que en el terreno literario y, en concreto, en la poesía, «muchas frases no se pueden entender como literales y pueden tener un significado diferente o estar llenas de simbolismo, como en el caso de las metáforas«.
Asimismo, las publicaciones e infraestructuras de inteligencia artificial están desarrolladas en inglés, por lo que es imprescindible generar esas mismas herramientas en castellano.

Por último, este proyecto está inspirado y vinculado con otro anterior, ‘Postdata’ (Poetry Standardization and Linked Open Data), con el que Ros y  Elena González-Blanco comenzaron a investigar el uso de la tecnología dentro del género literario.

Share This

Share This

Share this post with your friends!