Entradas

Postdata en la Conferencia anual de la Iniciativa de Metadatos Dublin Core

La Conferencia anual Internacional de la Iniciativa de Metadatos Dublin Core (DCMI), ha sido este año organizada por la Universidad de Oporto del 10 al 13 de septiembre en Portugal.

POSTDATA ha participado de la conferencia presentando el artículo “Validation of a metadata application profile domain model”.

El artículo completo se puede leer aquí.

La Iniciativa de Metadatos Dublin Core es una organización que ha surgido de una sucesión de talleres o reuniones de trabajo que, desde 1995, tienen el objetivo de encontrar una estrategia común para la localización y recuperación de recursos electrónicos en la web.

Para ver el programa de la conferencia 2018: http://dublincore.org/conference/2018/programme/

El proyecto POSTDATA ha nacido para crear un puente digital

POSTDATA es un proyecto financiado de ERC Starting Grants de investigación en humanidades digitales que busca comparar las distintas tradiciones poéticas utilizando la tecnología de la web semántica.

El proyecto POSTDATA “Poetry Standardization and Linked Open Data”, dirigido por Elena González-Blanco García y Salvador Ros Muñoz, es un proyecto del Consejo Europeo de Investigación (European Research Council) de más de un millón de euros con una duración de cinco años (inicio mayo 2016) en los ámbitos de la Ciencia y las Humanidades digitales.

El proyecto se ha convertido en líder de un programa pionero que suma a la Filología investigadores del ámbito de la documentación, la informática, la lingüística computacional y la tecnología de la web semántica y  los datos. El proyecto está integrado en el Laboratorio de Innovación en Humanidades Digitales de la UNED (LINHD), centro pionero en España y en español en este campo.

EL proyecto:

La necesidad de estandarización viene de la mano de la importancia de intercambiar conocimiento y fomentar el entendimiento entre los diferentes campos. Las disciplinas científicas establecieron de una forma temprana protocolos y lenguas para realizar ese trasvase de información, creando unos estándares que fueron rápidamente adquiridos y adaptados para resolver sus problemáticas específicas. Las áreas de humanidades y la cultura han seguido, sin embargo, un camino independiente en el que la creatividad y la tradición juegan un papel esencial. La literatura, y especialmente la poesía, constituyen un claro reflejo de esta idiosincrasia. Desde el punto de vista filológico, no hay un sistema uniforme de analizar, clasificar o estudiar las diferentes manifestaciones poéticas, y la divergencia de teorías es aún mayor cuando se comparan diferentes escuelas poéticas correspondientes a distintas lenguas y períodos. El proyecto POSTDATA ha nacido para crear ese puente digital entre los acervos culturales tradicionales y el mundo creciente de los datos. El proyecto se centra en el análisis, clasificación y publicación de la poesía aplicando metodologías de análisis propias de las Humanidades Digitales, como la codificación en XML-TEI, para buscar la estandarización. Los problemas de interoperabilidad entre las diferentes colecciones poéticas se resuelven utilizando tecnologías de la web semántica para enlazar y publicar conjuntos de datos literarios de forma estructurada en la nube de datos enlazados.

La ventaja de convertir la poesía en datos disponibles en línea legibles para máquina es triple: en primer lugar, la comunidad académica tendrá una plataforma digital accesible para trabajar con corpora poéticos, contribuyendo al enriquecimiento de los propios textos; segundo, esta forma de codificar y estandarizar la información poética, será una garantía de preservación para poemas conservados solamente en libros impresos, o incluso transmitidos oralmente; y tercero, los conjuntos de datos y los corpora estarán disponibles en acceso abierto para su uso con otras finalidades, como la educación, la difusión cultural o el entretenimiento.

Para lograr este fin, se ha creado un laboratorio de poesía dentro de la plataforma que permite a los usuarios aplicar las últimas tecnologías del lenguaje y de la lingüística computacional para analizar los datos poéticos. Algunas de estas herramientas incluyen un analizador métrico que detecta la estructura silábica de las estrofas y los patrones acentuales, el reconocimiento de entidades nombradas para extraer lugares, fechas y personas mencionadas, la combinación de lematizadores y parsers para identificar las estructuras sintácticas con propósitos poéticos y el análisis de sentimiento para descubrir emociones y sentimientos en los poemas. La combinación de todos estos procesos en el mismo entorno mejorará y facilitará el análisis a los investigadores, generando nuevas aplicaciones, como la detección automática del género poético o el análisis de figuras retóricas y estilísticas. .

Uno de los objetivos del proyecto es proporcionar a la comunidad científica de poesía los medios para que puedan publicar los resultados de su investigación como datos abiertos enlazados (LOD) y de esta manera, poder explotar las ventajas que ofrece este tipo de recursos, propios de la web semántica (la publicación de datos que puedan ser procesados por maquinas inteligentes).   

Siguiendo este objetivo, el proyecto ha diseñado un modelo de datos que contiene los conceptos necesarios para poder desarrollar investigación en poesía europea. Al ser esta una tarea muy ambiciosa (abarcar todas las lenguas, periodos, etc de la poesía europea), es necesaria la colaboración de investigadores de todas las tradiciones poéticas de Europa para que validen nuestro trabajo.

Con este fin el proyecto ha desarrollado un formulario que, a través de la inserción de datos resultantes del análisis de los expertos, comprueba que el modelo de postdata no tenga ninguna laguna conceptual.

Enlace al formulario http://postdata-model-validation.linhd.uned.es/

Gracias a este proceso de validación de nuestro trabajo, podremos poner a disposición de la comunidad investigadora en poesía, un modelo ontológico para datos abiertos enlazados.

POSTDATA participa del Congreso de Humanidades Digitales 2018 en Mexico

El congreso DH2018 (Humanidades Digitales 2018) tuvo lugar en la Ciudad de México entre el 26 y 29 de junio, organizado por The Association of Digital Humanities Organizations (ADHO),  El Colegio de México y la Universidad Nacional Autónoma de México (UNAM), en colaboración con la Red de Humanidades Digitales (RedHD). POSTDATA participó en el congreso con una presentación breve y un póster.

Presentamos la nueva versión de nuestro corpus DISCO, que consta de 4.000 sonetos en español de más de 1.000 autores, tanto canónicos como no, de Europa y América, que abarcan desde el siglo XV hasta el siglo XIX. El corpus se proporciona en TEI y texto simple, con diversos metadatos para describir a los autores, en TEI y a través de atributos RDFa (un formato de datos enlazados). El corpus tiene anotaciones literarias obtenidas a través del Procesamiento del Lenguaje Natural, concretamente escansión y encabalgamiento, y puede descargarse libremente aquí. El trabajo presentado se encuentra aquí.

 

También presentamos la interfaz web a ANJA, nuestra herramienta de detección de encabalgamiento en español, accesible aquí. Permite cargar poemas y obtener anotaciones de encabalgamiento según una tipología especializada. El trabajo se describe aquí.

 

¡El congreso fue un gran evento por el que debemos agradecer a la organización!

POSTDATA participa de la Conferencia sobre Ciencia Abierta y las Humanidades en Barcelona

La Ciencia Abierta es una práctica de la ciencia y un movimiento para hacer que la investigación científica, los datos y la difusión sean accesibles a todos los niveles de una sociedad investigadora en términos que permitan la reutilización, redistribución y replicabilidad de la investigación, de los datos y de los métodos subyacentes.

El pasado jueves 21 de Junio tuvo lugar la Conferencia sobre Ciencia Abierta y las Humanidades 2018 en la Universidad de Barcelona. En esta ocasión el Proyecto POSTDATA fue presentado por Luciana Ayciriex, actual Project Manager del proyecto.

La bienvenida estuvo a cargo de  Xavier Roigé Ventura, Vicerector de Doctorat i Promoció de la Recerca, Domènech Espriu Climent, Vicerector de Recerca, Àlex Aguilar Vila, Vicerector de Projecció i Internacionalizació y José Remesal de la Universidad de Barcelona.

POSTDATA: Open poetry, open science and linked open data

La conferencia fue organizada por la Universitat de Barcelona, SIRIS AcademicEP.NET, CEIPAC, ERC

Programa de la conferencia http://www.ub.edu/openscienceandthehumanities/es/programme/

LINHD participa en las VIII jornadas digitales, organizadas por la UNE y Editorial CSIC

Durante los días 7 y 8 de junio tuvieron lugar en Madrid las VIII Jornadas digitales de la Unión de Editoriales Universitarias Españolas con el título Edición académica: el entorno digital y sus retos.

 

El LINHD ha participado en la mesa redonda que versaba sobre el ecosistema del lector en el siglo XXI en el entorno digital y cuyo objetivo era poner sobre la mesa tanto las demandas de lectores como de investigadores. Nuestra representante hizo una breve presentación sobre la evolución de la edición filológica dentro del soporte digital centrándose en las demandas actuales de la comunidad investigadora en este ámbito.

 

Puede consultarse el programa completo del evento en la página de la asociación

 

El LINHD quiere agradecer a la UNE la oportunidad de participar en este interesante evento y en especial a Maribel Cabrera, directora de las Jornadas y directora de la Editorial Universidad de Granada, por su dedicación.

Reportaje fotográfico de las VIII Jornadas digitales