El proyecto POSTDATA ha nacido para crear un puente digital

POSTDATA es un proyecto financiado de ERC Starting Grants de investigación en humanidades digitales que busca comparar las distintas tradiciones poéticas utilizando la tecnología de la web semántica.

El proyecto POSTDATA “Poetry Standardization and Linked Open Data”, dirigido por Elena González-Blanco García y Salvador Ros Muñoz, es un proyecto del Consejo Europeo de Investigación (European Research Council) de más de un millón de euros con una duración de cinco años (inicio mayo 2016) en los ámbitos de la Ciencia y las Humanidades digitales.

El proyecto se ha convertido en líder de un programa pionero que suma a la Filología investigadores del ámbito de la documentación, la informática, la lingüística computacional y la tecnología de la web semántica y  los datos. El proyecto está integrado en el Laboratorio de Innovación en Humanidades Digitales de la UNED (LINHD), centro pionero en España y en español en este campo.

EL proyecto:

La necesidad de estandarización viene de la mano de la importancia de intercambiar conocimiento y fomentar el entendimiento entre los diferentes campos. Las disciplinas científicas establecieron de una forma temprana protocolos y lenguas para realizar ese trasvase de información, creando unos estándares que fueron rápidamente adquiridos y adaptados para resolver sus problemáticas específicas. Las áreas de humanidades y la cultura han seguido, sin embargo, un camino independiente en el que la creatividad y la tradición juegan un papel esencial. La literatura, y especialmente la poesía, constituyen un claro reflejo de esta idiosincrasia. Desde el punto de vista filológico, no hay un sistema uniforme de analizar, clasificar o estudiar las diferentes manifestaciones poéticas, y la divergencia de teorías es aún mayor cuando se comparan diferentes escuelas poéticas correspondientes a distintas lenguas y períodos. El proyecto POSTDATA ha nacido para crear ese puente digital entre los acervos culturales tradicionales y el mundo creciente de los datos. El proyecto se centra en el análisis, clasificación y publicación de la poesía aplicando metodologías de análisis propias de las Humanidades Digitales, como la codificación en XML-TEI, para buscar la estandarización. Los problemas de interoperabilidad entre las diferentes colecciones poéticas se resuelven utilizando tecnologías de la web semántica para enlazar y publicar conjuntos de datos literarios de forma estructurada en la nube de datos enlazados.

La ventaja de convertir la poesía en datos disponibles en línea legibles para máquina es triple: en primer lugar, la comunidad académica tendrá una plataforma digital accesible para trabajar con corpora poéticos, contribuyendo al enriquecimiento de los propios textos; segundo, esta forma de codificar y estandarizar la información poética, será una garantía de preservación para poemas conservados solamente en libros impresos, o incluso transmitidos oralmente; y tercero, los conjuntos de datos y los corpora estarán disponibles en acceso abierto para su uso con otras finalidades, como la educación, la difusión cultural o el entretenimiento.

Para lograr este fin, se ha creado un laboratorio de poesía dentro de la plataforma que permite a los usuarios aplicar las últimas tecnologías del lenguaje y de la lingüística computacional para analizar los datos poéticos. Algunas de estas herramientas incluyen un analizador métrico que detecta la estructura silábica de las estrofas y los patrones acentuales, el reconocimiento de entidades nombradas para extraer lugares, fechas y personas mencionadas, la combinación de lematizadores y parsers para identificar las estructuras sintácticas con propósitos poéticos y el análisis de sentimiento para descubrir emociones y sentimientos en los poemas. La combinación de todos estos procesos en el mismo entorno mejorará y facilitará el análisis a los investigadores, generando nuevas aplicaciones, como la detección automática del género poético o el análisis de figuras retóricas y estilísticas. .

Uno de los objetivos del proyecto es proporcionar a la comunidad científica de poesía los medios para que puedan publicar los resultados de su investigación como datos abiertos enlazados (LOD) y de esta manera, poder explotar las ventajas que ofrece este tipo de recursos, propios de la web semántica (la publicación de datos que puedan ser procesados por maquinas inteligentes).   

Siguiendo este objetivo, el proyecto ha diseñado un modelo de datos que contiene los conceptos necesarios para poder desarrollar investigación en poesía europea. Al ser esta una tarea muy ambiciosa (abarcar todas las lenguas, periodos, etc de la poesía europea), es necesaria la colaboración de investigadores de todas las tradiciones poéticas de Europa para que validen nuestro trabajo.

Con este fin el proyecto ha desarrollado un formulario que, a través de la inserción de datos resultantes del análisis de los expertos, comprueba que el modelo de postdata no tenga ninguna laguna conceptual.

Enlace al formulario http://postdata-model-validation.linhd.uned.es/

Gracias a este proceso de validación de nuestro trabajo, podremos poner a disposición de la comunidad investigadora en poesía, un modelo ontológico para datos abiertos enlazados.

Invitación a participar de la encuesta sobre Infraestructuras Digitales

Estimados investigadores e investigadoras relacionados con las Humanidades Digitales. Os queremos informar de dos eventos de interés para la comunidad de Humanidades Digitales.

Por una parte, informaros que estamos organizando para el próximo 30 de octubre de 2018, un Workshop conjuntamente con DARIAH y DESIR que se celebrará en la Universidad Nacional de Educación a Distancia. Esperamos contar del Ministerio de Ciencia, Innovación y Universidades y de representantes de CLARIN. Para finalizar se realizará una reunión plenaria en la que nos gustaría que participaran todas aquellas personas e instituciones relacionadas con las humanidades digitales en España, para lo cual esperamos contar con vuestra presencia e intervenciones. El objetivo es discutir las oportunidades de colaboración en el tema de las infraestructuras para nuestros proyectos, las contribuciones de DARIAH en este sentido y CLARIN y buscar un consenso en relación a la estrategia de incorporación de España en DARIAH y CLARIN.

Por otro lado, como parte del trabajo que nos gustaría presentar en este workshop, os invitamos, a completar un formulario en línea sobre las HD y sus infraestructuras. Mediante este formulario identificaremos, gracias a una herramienta metodológica que se ha desarrollado, las infraestructuras HD en uso en España. Esta herramienta tiene el objetivo de realizar un mapeo de la situación española referente a las infraestructuras digitales en HD, así como de incentivar la colaboración estratégica en los proyectos que emprendemos y enfocar el acceso y uso de estas a las necesidades específicas, en beneficio de los proyectos de los integrantes de la futura red. Los resultados de la aplicación de esta herramienta metodológica serán presentados en el workshop de DARIAH, el próximo mes de octubre.

 

 

Invitación a participar de la encuesta sobre Humanidades Digitales

La transformación digital plantea desafíos para el panorama de la investigación de las artes y las humanidades en todo el mundo. DARIAH (Infraestructura de Investigación Digital en Artes y Humanidades) es una red europea (ERIC- European Research Infrastructure Consortium) para mejorar y desarrollar la investigación digital de humanidades en Europa.

DESIR es un proyecto financiado por la Comisión Europea que se propone fortalecer la sostenibilidad de DARIAH y establecerlo firmemente como un líder a largo plazo y socio dentro de las comunidades de artes y humanidades. La UNED participa activamente como socio del proyecto a través de su Laboratorio de Innovación en Humanidades Digitales (LINHD)

El proyecto ha desarrollado recientemente una encuesta para aquellos usuarios o potenciales usuarios de las humanidades digitales. Los resultados permitirán evaluar la confianza actual en DARIAH y llevar a la propuesta de estrategias y acciones que aumenten la confianza en los servicios e infraestructuras de la red.

 

Enlace para completar el cuestionario:

https://surveys.fcsh.unl.pt/index.php/995839?lang=en

 

 

Elena Álvarez Mellado, ganadora del XXII Premio Nacional Miguel Delibes

Elena Álvarez Mellado ha recibido el XXII Premio Nacional de Periodismo Miguel Delibes, que otorga la Asociación de la Prensa de Valladolid, por su artículo Metáforas peligrosas: el cáncer como lucha, publicado en eldiario.es. Lingüista de formación y especializada en lingüística computacional, ha trabajado para la Fundación del Español Urgente (Fundéu) y Molino de Ideas. Actualmente forma parte del equipo de investigación de POSTDATA de la UNED, un proyecto europeo de investigación participado por la Facultad de Filología y la Escuela de Ingeniería Informática de la UNED. Es la tercera mujer que recibe este galardón en sus 22 años de existencia.

 

El Premio Nacional de Periodismo Miguel Delibes,  fue creado en 1996 por la Asociación de la Prensa de Valladolid y tiene como objetivo reconocer trabajos que defienden el buen uso del español en los medios de comunicación y destacan por la protección y la pervivencia de la lengua española, lo que lo convierte en único en su ámbito temático.

Entrevista UNED https://portal.uned.es/portal/page?_pageid=93,60741972&_dad=portal&_schema=PORTAL 

Elena González-Blanco García, premio Julián Marías de Investigación 2017

La Investigadora principal de POSTDATA y fundadora del LINHD, Elena González-Blanco ha sido galardonada con el prestigioso premio “Julián Marías” 2017, en la categoría de “investigadores de menos de 40 años”.

Los Premios de Investigación de la Comunidad de Madrid “Julián Marías” tienen por objeto reconocer la actividad científica, así como los valores científicos y humanísticos desarrollados por investigadores de menos de cuarenta años, que a lo largo de su trayectoria profesional hayan estado de alguna forma vinculados a la Comunidad de Madrid. Se convocan anualmente en las dos áreas, Ciencias y Humanidades.

 

Especialista en el ámbito de la tecnología lingüística, Elena González-Blanco lidera POSTDATA, un proyecto de investigación europeo H2020 de excelencia ERC sobre poesía y web semántica, con una dotación presupuestaria de más de un millón de euros. Ha sido la directora y fundadora del primer Laboratorio de Innovación en Humanidades Digitales en español: www.linhd.uned.es, la Presidenta de la Asociación de Humanidades Digitales Hispánicas, y la Secretaria de la Alliance for Digital Humanities Organizations. Es además miembro del Comité Ejecutivo de la European Association for Digital Humanities, del Centernet Committee for DH centers, del Scientific Advisory Board de la infraestructura europea de investigación en tecnología lingüística www.clarin.eu, y del comité directivo de Global Outlook: Digital Humanities. Es Doctora en Filología Hispánica con Premio Extraordinario y 1º Premio Nacional de Licenciatura en Filología Hispánica y Filología Clásica. Máster en Bibliotecas Digitales de la UC3M, ha sido docente e investigadora en Harvard University (2 años como Teaching Assistant), King’s College, UNAM y Bonn. Habla inglés, francés, alemán e italiano y es madre de 4 hijos. Ha sido además elegida como una de las “Top100 Mujeres Líderes en España” (www.lastop100.com) en las dos últimas ediciones de 2016 y 2017.