Presentación de POSTDATA en DH 2019: “Towards a common poetry model: challenges and solutions”

Este paper, presentado en DH2019, se basa en el análisis de múltiples recursos poéticos disponibles en línea, así como en los resultados de las discusiones metodológicas con estudiosos de la literatura europea. El objetivo es recuperar las necesidades de información de las diferentes fuentes para construir un modelo de datos común para la Poesía Europea. Así, mediante la aplicación de un método de ingeniería inversa, se ha creado el Modelo de Dominio para la Poesía Europea, que es un hito importante para hacer interoperables los recursos poéticos existentes. En este trabajo se presentarán algunos de los desafíos que se han encontrado al realizar una conceptualización de la información relevante para el análisis poético y le modo de trabajo en torno a ellos.

Resumen: https://doi.org/10.5281/zenodo.3335509

Presentación: https://doi.org/10.5281/zenodo.3337805

Elena González-Blanco, IP de Postdata, hablará de inteligencia artificial, tecnologías del lenguaje y poesía en una sesión de Techtalk dedicada a Inteligencia Artificial

“Inteligencia artificial y lenguaje: ¿llegarán las máquinas a hablar como los hombres?”

La inteligencia artificial está ahora mismo en boca de todos, y sin embargo es una disciplina cuyos algoritmos comenzaron a desarrollarse hace más de cuatro décadas. En los años 50, Alan Turing planteaba el juego de la imitación preguntándose cuándo una máquina sería capaz de confundirse en una conversación con una persona ¿cuánto nos queda para llegar hasta ese momento? ¿hasta dónde ha llegado la tecnología y cuáles son los retos? ¿cuáles son las principales aplicaciones al negocio y al mundo real? ¿cómo cambiará el futuro cercano?

“El cuadro de las redes neuronales artificiales”

Las redes de neuronas se han convertido en una pieza clave en el proceso de aprendizaje automático (Machine Learning) pero ¿para qué sirven? ¿cuántos tipos hay? ¿Cómo empiezo? ¿Qué caracteriza a cada una? En esta charla aprenderás los conceptos básicos y los variopintos casos de uso como reconocer un idioma, jugar a la NES o pintar un Van Gogh.

Inscríbete aquí

 

PROGRAMA

18:30 Bienvenida y recepción de los asistentes

19:00 Elena Gonzalez-Blanco: Inteligencia artificial y lenguaje: ¿llegarán las máquinas a hablar como los hombres?

19:30 Nerea Luis: El cuadro de las redes de neuronas artificiales

20:15 Cervecitas, picoteo y networking

 

FECHA Y HORA

mar. 11 de junio de 2019

18:30 – 20:30 CEST

112 Calle del Príncipe de Vergara

28002 Madrid

 

BIOGRAFÍAS

Elena González-Blanco

Elena González-Blanco es la General Manager de Europa en Coverwallet. Especialista en el ámbito de la tecnología lingüística, ha sido Responsable de Desarrollo de Producto en Inteligencia Artificial de Minsait-Indra y es además una Investigadora de reconocido prestigio internacional, que lidera POSTDATA, proyecto de investigación europeo de excelencia ERC sobre poesía y web semántica. Fue la directora y fundadora del primer Laboratorio de Innovación en Humanidades Digitales en español: www.linhd.es., y miembro de varios comités científicos europeos. Es Doctora en Filología Hispánica y 1º Premio Nacional de Licenciatura en Hispánicas y Clásicas. Máster en Bibliotecas Digitales de la UC3M, ha sido docente e investigadora en Harvard University, King’s College, UNAM y Bonn. Elegida número #1 en el Ranking Choiseul 2018 “Líderes Económicos del futuro de España, ha sido seleccionada como una de las Top 100 mujeres de España en las ediciones del año 2016, 2017 y 2018 del certamen www.lastop100.es y ha sido galardonada con el premio de investigación Julián Marías 2017 en la categoría de menores de 40 años. Habla inglés, francés, alemán e italiano y es madre de 4 hijos.

https://www.linkedin.com/in/elena-gonzalez-blanco/

Nerea Luis Mingueza

Graduada en Informática en 2013, y Master en 2014 en Computer Science and Technology por la Universidad Carlos III de Madrid. Actualmente finaliza sus estudios de doctorado en la Carlos III. Es un activa y premiada divulgadora y comunicadora científica. En 2016 obtuvo el premio Google Anita Borg, por sus iniciativas tecnológicas llevadas a cabo de forma altruista en paralelo a su carrera académica. Entre ellas se encuentra T3chFest, evento de divulgación tecnológica de la UC3M que además promueve y resalta la falta de diversidad en dicho sector. En 2018 la Fundación COTEC la seleccionó como experta en Tecnología, Talento y Género dentro de su red “Los 100 de Cotec”. Ese mismo año fue seleccionada como técnico de asesoramiento científico, en la iniciativa Ciencia en el Parlamento promovida por el Congreso de los Diputados. También en 2018 ha sido ganadora del reconocimiento Innovadoras TIC por la Fundación Cibervoluntarios. Recientemente, el medio Business Insider la ha reconocido como uno de los 23 talentos menores de 35 años dispuestos a liderar la revolución tecnológica.

https://www.linkedin.com/in/nerealuis/

DARIAH Annual Event 2019: Humanities Data

Salvador Ros asiste a la conferencia anual de DARIAH. La presencia de los grupos españoles ha sido notoria gracias a las acción dirigida desde el proyecto Desir que tienen como objetivo impulsar la adhesion de España en Dariah.
Linhd lidera con el apoyo de los investigadores españoles esta iniciativa que es es de todos y para todos. En esta conferencia queda claro la necesidad de la formación en el uso de las tecnologías , en este sentido LINHD esta comprometido y apoya esta iniciativas como el curso de verano Creando un proyecto de Humanidades Digitales usando el modelado de datos y el procesamiento de textos que se  llevará a cabo entre los días 1 y 3 de julio de 2019 en la UNED. 

Este año, el curso DH@Madrid Summer School se propone que los estudiantes puedan abordar un proyecto de humanidades digitales, centrado en textos, desde su inicio. Se comenzará con un modelado del dominio definiendo una ontología orientada a datos enlazados (LOD) para seguir con la generación de código que resuelva o ayude a resolver las preguntas de investigación. Se hará uso de los nuevos paradigmas computacionales relacionados con técnicas que provienen del mundo de la Inteligencia Artificial en su sentido más amplio (procesamiento de textos, deep learning, etc.). Finalmente, se realizarán ejercicios para representar los resultados.

Ya está abierto el plazo para matricularte, puedes obtener más información pinchando aquí.

 

 

DH@Madrid Summer School 2019

La escuela de verano DH@Madrid Summer School 2019 es un evento anual que se organiza cada año desde 2014. En esta oportunidad, se realizará el curso “Creando un proyecto de Humanidades Digitales usando el modelado de datos y el procesamiento de textos” que se  llevará a cabo entre los días 1 y 3 de julio de 2019 en la UNED. 

Este año, el curso DH@Madrid Summer School se propone que los estudiantes puedan abordar un proyecto de humanidades digitales, centrado en textos, desde su inicio. Se comenzará con un modelado del dominio definiendo una ontología orientada a datos enlazados (LOD) para seguir con la generación de código que resuelva o ayude a resolver las preguntas de investigación. Se hará uso de los nuevos paradigmas computacionales relacionados con técnicas que provienen del mundo de la Inteligencia Artificial en su sentido más amplio (procesamiento de textos, deep learning, etc.). Finalmente, se realizarán ejercicios para representar los resultados.

¡Pulse aquí para entrar en la página del curso !

 

 

Se contará ademas, con la colaboración de expertos  en Humanidades Digitales y  procesamiento de textos y estará dirigido a especialistas en Humanidades Digitales, lingüistas, investigadores, profesores, académicos, y estudiantes tanto de máster como de doctorado, preferentemente en disciplinas humanísticas, pero también en disciplinas como informática o ciencias de la información.

 

 

La escuela está cofinanciada por el proyecto ERC POSTDATA y la Fundación UNED.

 

POSTDATA presente en la conferencia inaugural EADH 2018: “Datos en las Humanidades Digitales” en la Universidad Nacional de Irlanda

La Asociación Europea de Humanidades Digitales (EADH) celebró su primera conferencia anual relacionada con el tema general de “Datos en las Humanidades Digitales” en la Universidad Nacional de Irlanda, Galway del 7 al 9 de diciembre de 2018.

Entre los conferencistas participaron Elisabeth Burr (Universidad de Leipzig) y Vladimir A. Plungian (Academia Rusa de Ciencias). Una sesión de mesa redonda sobre el tema de los datos y las humanidades digitales fue presidida por Christof Schöch.

Salvador Ros Muñoz, Director Técnico de POSTDATA en la UNED, presentó los avances del proyecto.

Link al programa completo

POSTDATA en televisión española

Elena Gonzalez-Blanco y Salvador Ros Muñoz participaron del ciclo te televisión educativa que comparten la 2 y la UNED.

El programa se ha emitido el viernes 30 de noviembre en la 2 en el programa semanal que difunde RTVE junto a la Universidad.

El mismo se enmarca en la Jornada de Inteligencia Artificial “Thinking Party”, de la que Elena Gonzalez-Blanco ha participado como panelista y en la muestra “Nosotros, Robots“, realizadas ambas en el Espacio Fundación Telefónica.

La jornada “Thinking Party”, realizada el 25 de octubre, ha centrado su contenido en dos ejes fundamentales que vertebran el debate sobre los usos de la Inteligencia Artificial: sus aplicaciones relacionadas con la creatividad y el conocimiento, desde la perspectiva humanística, y sus implicaciones éticas y legales.

Por su parte, la muestra “Nosotros, Robots”, reflexiona, a través de una selección de cerca de cincuenta robots, sobre los retos a los que se enfrenta la humanidad ante el desarrollo imparable de estas máquinas, y, además, sobre las posibilidades que ofrecen para transformar el futuro. La muestra, comisariada por el escritor y analista Andrés Ortega y, organizada en colaboración con Casual Robots, puede verse en la tercera planta de Espacio Fundación Telefónica, del 5 de octubre de 2018 al 3 de febrero de 2019.

 

Durante el programa, Elena Gonzalez-Blanco y Salvador Ros Muñoz exploran el panorama actual respecto a la robótica y la inteligencia artificial centrándose en el sector educativo como eje del reportaje.

 

Link al programa completo https://www.youtube.com/watch?v=pUzRiebuROQ

Elena González-Blanco recibe el premio Julián Marías de Investigación

En una ceremonia celebrada en la Real Academia de las Ciencias Exactas, Físicas y Naturales, el consejero madrileño de Educación, Rafael van Grieken, entregó los premios Julián Marías” y “Miguel Catalán” a nueve destacados investigadores.

La Investigadora principal de POSTDATA, fundadora del LINHD, y directora general de CoverWalletElena González-Blanco ha sido galardonada con el premio “Julián Marías” 2017, en la categoría de investigadores de menos de 40 años, “por ser pionera en el área de las humanidades digitales y líder en el proceso de avance de España hacia la inserción en las grandes infraestructuras europeas”. Cabe destacar que Elena ha sido la única mujer que ha recibido este premio en esta oportunidad.

Discurso de Elena Gonzalez-Blanco

Los Premios de Investigación de la Comunidad de Madrid “Julián Marías” tienen por objeto reconocer la actividad científica, así como los valores científicos y humanísticos desarrollados por investigadores de menos de cuarenta años, que a lo largo de su trayectoria profesional hayan estado de alguna forma vinculados a la Comunidad de Madrid. Se convocan anualmente en las dos áreas, Ciencias y Humanidades.

Especialista en el ámbito de la tecnología lingüística, Elena González-Blanco lidera POSTDATA, un proyecto de investigación europeo H2020 de excelencia ERC sobre poesía y web semántica, con una dotación presupuestaria de más de un millón de euros. Ha sido la directora y fundadora del primer Laboratorio de Innovación en Humanidades Digitales en español: www.linhd.uned.es, la Presidenta de la Asociación de Humanidades Digitales Hispánicas, y la Secretaria de la Alliance for Digital Humanities Organizations. Es además miembro del Comité Ejecutivo de la European Association for Digital Humanities, del Centernet Committee for DH centers, del Scientific Advisory Board de la infraestructura europea de investigación en tecnología lingüística www.clarin.eu, y del comité directivo de Global Outlook: Digital Humanities. Es Doctora en Filología Hispánica con Premio Extraordinario y 1º Premio Nacional de Licenciatura en Filología Hispánica y Filología Clásica. Máster en Bibliotecas Digitales de la UC3M, ha sido docente e investigadora en Harvard University (2 años como Teaching Assistant), King’s College, UNAM y Bonn. Habla inglés, francés, alemán e italiano y es madre de 4 hijos. Ha sido además elegida como una de las “Top100 Mujeres Líderes en España” (www.lastop100.com) en las dos últimas ediciones de 2016 y 2017.

El proyecto Postdata en la Conferencia Anual de CLARIN

La Conferencia Anual de CLARIN fue organizada CLARIN ERIC, en colaboración con el Instituto de Lingüística Computacional (ILC) que forma parte del Departamento de Ciencias Sociales y Humanidades, Patrimonio Cultural (DSU) del Consejo Nacional de Investigación de Italia (CNR)

CLARIN2018 tuvo como objetivo intercambiar ideas y experiencias acerca del funcionamiento y servicios de CLARIN, así como su utilidad por parte de la comunidad de investigadores y su relación con otras infraestructuras y proyectos.

Del encuentro han participado Elena González-Blanco, directora general de CoverWallet en Europa e Investigadora principal de POSTDATA y Salvador Ros, Coordinador del proyecto DESIR y coordinador técnico de POSTADATA. Los principales resultados y herramientas del proyecto se han presentado durante el evento https://zenodo.org/record/1465501#.W8m8a0szbIU .

Las herramientas de poesía están destinadas a ser un mercado de código abierto donde se encuentran diferentes herramientas para procesar poesía desde la detección del modelo de poesía hasta procesos semánticos más complejos. Pero no solo está dedicado a los procesos de poesía, sino a cualquier proceso que mejore y permita una comprensión más profunda de la misma.

Las herramientas de POSTDATA que fueron presentadas son ANJA y HISMETAG. Una está relacionada con el concepto de enjambment y la segunda está relacionada con el reconocimiento de las entidades nombradas en los textos medievales.

Para más información del proyecto POSTDATA podéis visitar:

http://postdata.linhd.uned.es

 

 

Postdata en la Conferencia anual de la Iniciativa de Metadatos Dublin Core

La Conferencia anual Internacional de la Iniciativa de Metadatos Dublin Core (DCMI), ha sido este año organizada por la Universidad de Oporto del 10 al 13 de septiembre en Portugal.

POSTDATA ha participado de la conferencia presentando el artículo “Validation of a metadata application profile domain model”.

El artículo completo se puede leer aquí.

La Iniciativa de Metadatos Dublin Core es una organización que ha surgido de una sucesión de talleres o reuniones de trabajo que, desde 1995, tienen el objetivo de encontrar una estrategia común para la localización y recuperación de recursos electrónicos en la web.

Para ver el programa de la conferencia 2018: http://dublincore.org/conference/2018/programme/

El proyecto POSTDATA ha nacido para crear un puente digital

POSTDATA es un proyecto financiado de ERC Starting Grants de investigación en humanidades digitales que busca comparar las distintas tradiciones poéticas utilizando la tecnología de la web semántica.

El proyecto POSTDATA “Poetry Standardization and Linked Open Data”, dirigido por Elena González-Blanco García y Salvador Ros Muñoz, es un proyecto del Consejo Europeo de Investigación (European Research Council) de más de un millón de euros con una duración de cinco años (inicio mayo 2016) en los ámbitos de la Ciencia y las Humanidades digitales.

El proyecto se ha convertido en líder de un programa pionero que suma a la Filología investigadores del ámbito de la documentación, la informática, la lingüística computacional y la tecnología de la web semántica y  los datos. El proyecto está integrado en el Laboratorio de Innovación en Humanidades Digitales de la UNED (LINHD), centro pionero en España y en español en este campo.

EL proyecto:

La necesidad de estandarización viene de la mano de la importancia de intercambiar conocimiento y fomentar el entendimiento entre los diferentes campos. Las disciplinas científicas establecieron de una forma temprana protocolos y lenguas para realizar ese trasvase de información, creando unos estándares que fueron rápidamente adquiridos y adaptados para resolver sus problemáticas específicas. Las áreas de humanidades y la cultura han seguido, sin embargo, un camino independiente en el que la creatividad y la tradición juegan un papel esencial. La literatura, y especialmente la poesía, constituyen un claro reflejo de esta idiosincrasia. Desde el punto de vista filológico, no hay un sistema uniforme de analizar, clasificar o estudiar las diferentes manifestaciones poéticas, y la divergencia de teorías es aún mayor cuando se comparan diferentes escuelas poéticas correspondientes a distintas lenguas y períodos. El proyecto POSTDATA ha nacido para crear ese puente digital entre los acervos culturales tradicionales y el mundo creciente de los datos. El proyecto se centra en el análisis, clasificación y publicación de la poesía aplicando metodologías de análisis propias de las Humanidades Digitales, como la codificación en XML-TEI, para buscar la estandarización. Los problemas de interoperabilidad entre las diferentes colecciones poéticas se resuelven utilizando tecnologías de la web semántica para enlazar y publicar conjuntos de datos literarios de forma estructurada en la nube de datos enlazados.

La ventaja de convertir la poesía en datos disponibles en línea legibles para máquina es triple: en primer lugar, la comunidad académica tendrá una plataforma digital accesible para trabajar con corpora poéticos, contribuyendo al enriquecimiento de los propios textos; segundo, esta forma de codificar y estandarizar la información poética, será una garantía de preservación para poemas conservados solamente en libros impresos, o incluso transmitidos oralmente; y tercero, los conjuntos de datos y los corpora estarán disponibles en acceso abierto para su uso con otras finalidades, como la educación, la difusión cultural o el entretenimiento.

Para lograr este fin, se ha creado un laboratorio de poesía dentro de la plataforma que permite a los usuarios aplicar las últimas tecnologías del lenguaje y de la lingüística computacional para analizar los datos poéticos. Algunas de estas herramientas incluyen un analizador métrico que detecta la estructura silábica de las estrofas y los patrones acentuales, el reconocimiento de entidades nombradas para extraer lugares, fechas y personas mencionadas, la combinación de lematizadores y parsers para identificar las estructuras sintácticas con propósitos poéticos y el análisis de sentimiento para descubrir emociones y sentimientos en los poemas. La combinación de todos estos procesos en el mismo entorno mejorará y facilitará el análisis a los investigadores, generando nuevas aplicaciones, como la detección automática del género poético o el análisis de figuras retóricas y estilísticas. .

Uno de los objetivos del proyecto es proporcionar a la comunidad científica de poesía los medios para que puedan publicar los resultados de su investigación como datos abiertos enlazados (LOD) y de esta manera, poder explotar las ventajas que ofrece este tipo de recursos, propios de la web semántica (la publicación de datos que puedan ser procesados por maquinas inteligentes).   

Siguiendo este objetivo, el proyecto ha diseñado un modelo de datos que contiene los conceptos necesarios para poder desarrollar investigación en poesía europea. Al ser esta una tarea muy ambiciosa (abarcar todas las lenguas, periodos, etc de la poesía europea), es necesaria la colaboración de investigadores de todas las tradiciones poéticas de Europa para que validen nuestro trabajo.

Con este fin el proyecto ha desarrollado un formulario que, a través de la inserción de datos resultantes del análisis de los expertos, comprueba que el modelo de postdata no tenga ninguna laguna conceptual.

Enlace al formulario http://postdata-model-validation.linhd.uned.es/

Gracias a este proceso de validación de nuestro trabajo, podremos poner a disposición de la comunidad investigadora en poesía, un modelo ontológico para datos abiertos enlazados.