Número especial de la Revista de Poética Medieval sobre los repertorios poéticos digitales, coordinado por Elena González-Blanco y Helena Bermúdez

La Revista de Poética Medieval acaba de publicar su nuevo número titulado “Los repertorios poéticos digitales: del Medievo a la interoperabilidad”.

Este monográfico, coordinado por las profesoras Elena González-Blanco y Helena Bermúdez, se centra en los recursos poéticos on-line y los diferentes métodos computacionales aplicados al estudio de la poesía.

 La Edad Media es el período en el que se centran la mayor parte de los repertorios digitales de poesía. Dichos repertorios permiten ver cómo cada país, tradición filológica y género literario ha seguido una evolución independiente y particular. Como resultado de ello, el acceso en línea a las colecciones de poesía está muy fragmentado, provocando un problema de incomunicación interlingüística. Sin embargo, gracias a la tecnología y a la inclusión de los big data y de los algoritmos se puede abordar esta problemática desde un punto de vista digital, haciendo que los propios datos en los que los ordenadores convierten a los textos y a los corpus permitan volver a hacer estas tradiciones «interoperables».

Este monográfico de La Revista de Poética Medieval presenta algunos de los repertorios digitales que recogen la variedad, riqueza y singularidad de la poesía medieval europea a través de sus diferentes evoluciones.

Esta es también la perspectiva que se aborda en el proyecto europeo de investigación Poetry Standardization and Linked Open Data (POSTDATA), en cuyo marco se desarrolla el contenido de este monográfico.

Para más información:

https://recyt.fecyt.es/index.php/revpm

 

Sobre Revista de Poética Medieval:

Fundada en 1997, la Revista de Poética Medieval es una publicación anual dedicada al estudio de la poética y a la reflexión teórica y crítica sobre la literatura medieval hispánica e internacional. Sus páginas están abiertas a investigaciones originales de alta calidad científica. La Revista de Poética Medieval provee acceso libre a su contenido y está indexada en numerosas bases de datos que garantizan la alta calidad de la publicación como Latindex o ERIH Plus.

Nueva herramienta desarrollada por el equipo de POSTDATA para spaCy

En POSTDATA usamos la librería de procesamiento de lenguaje natural para Python, spaCy. Se está convirtiendo en un estándar en la industria, pero, aunque generalmente funciona bien, todavía hay que pulir un poco el soporte para español.
Un problema que nos surgió con esta librería fue que no detecta bien los pronombres clíticos (por ejemplo, en palabras como «dímelo», «piérdete» o «hazme»). Esto se debe a que spaCy usa un modelo de datos para español que no ha sido entrenado de manera apropiada para este tipo de palabras.
Para solucionar este problema hemos estado trabajando en una extensión para spaCy que nos permite una identificación y separación apropiada, tanto de la palabra raíz, como de sus sufijos. Esta herramienta open source ha sido liberada y se puede instalar muy fácilmente desde python con un simple «pip install spacy_affixes». En la página de github del proyecto se puede encontrar toda la documentación necesaria:

https://github.com/linhd-postdata/spacy-affixes

¿Cómo funciona?
El funcionamiento es muy simple: nos bajamos archivos de reglas para afijos (que obtendremos de la herramienta Freeling http://nlp.lsi.upc.edu/freeling/index.php/node/1 ) y tras implementar sus reglas en python, añadimos este nuevo comportamiento al «pipeline» (el flujo de trabajo) de spaCy. Gracias a esto obtenemos unos resultados mucho más precisos de los que obtiene spaCy en esta tarea. Es una pieza clave de las herramientas desarrolladas por el equipo de POSTDATA dentro de la suite de PoetryLab y nos enorgullece mucho poder liberarla y compartirla con el resto de la comunidad NLP. Es nuestro granito de arena en un campo en el que hay tan pocos recursos libres para español, como es el de procesamiento del lenguaje natural.

 

Entrevista a Elena González-Blanco en #WATTBA Podcast

Elena González-Blanco, Investigadora Principal de POSTDATA, ha participado en el Podcast #WATTBA para hablar sobre tecnologías del lenguaje e inteligencia artificial: «Estamos en la etapa de las interfaces conversacionales, donde pasamos de la pantalla a la interfaz de voz». También ha hablado sobre la digitalización de las Humanidades y el proyecto europeo de humanidades digitales POSTDATA.

Entrevista completa en el siguiente enlace:

https://www.ivoox.com/wattba-elena-gonzalez-blanco-tenemos-desterrar-la-audios-mp3_rf_44664297_1.html

Presentación de la investigación H2020 DESIR-DARIAH «Digital Humanities Research in Spain»

El Laboratorio de Innovación en Humanidades Digitales y POSTDATA han participado en la Asamblea General de DARIAH, celebrada en Zagreb los días 6 y 7 de noviembre. En dicha asamblea se han presentado los resultados preliminares del proyecto H2020 DESIR-DARIAH «Digital Humanities Research in Spain».

La investigación, coordinada por Salvador Ros, ha sido desarrollada por los investigadores Maurizio Toscano y Aroa Rabadán. En la presentación se ha destacado la metodología empleada por ambos investigadores, que incluye datos referidos a los investigadores, proyectos, recursos, revistas y formación en HD siguiendo diferentes líneas temáticas como su distribución geográfica, líneas de investigación frecuentes y la financiación obtenida por los proyectos en España. De especial interés ha sido la exposición de datos como el número de investigadores en HD con respecto a su género—hombres (51 %) y mujeres (49 %)—y la proporción de todos ellos en relación a los investigadores de las Humanidades genéricas—hombres (58%) y mujeres (42 %)—en el año del último estudio realizado (2016).

El estudio completo se presentará en un informe donde se recogerán todos estos datos revisados y ampliados.

 Más información sobre el estudio en: DARIAH-EU.

Presentación de POSTDATA: «Una red de ontologías para la poesía europea»

La ponencia «Una red de ontologías para la poesía europea» de Mª Luisa Díez Platas, investigadora de POSTDATA, fue presentada en el IV Congreso de Humanidades Digitales y Patrimonio Cultural celebrado en Toledo, del 23 al 25 de octubre de 2019.

En dicha ponencia se mostró el proceso de construcción de la red de ontologías a partir de un modelo conceptual. Esta red conceptualiza y estructura la información sobre todos los aspectos del conocimiento relacionados con la poesía europea. Asimismo, se han presentado las técnicas y herramientas utilizadas para la generación y publicación de las ontologías de la red de ontologías. Hay cuatro ontologías ya publicadas:

Para más información sobre la red de ontologías de POSTDATA, visite:

http://postdata-prototype.linhd.uned.es/ontology.php

 


Illustration 2. Ontology Network Diagram

 

Presentación de la investigación “Impacto de las Humanidades Digitales en España” de H2020 DESIR-DARIAH

El Laboratorio de Innovación de Humanidades Digitales y POSTDATA participan en el 4º Congreso de la Asociación de Humanidades Digitales Hispánicas que se celebra en Toledo, los días 23, 24 y 25 de octubre, bajo el título «Humanidades Digitales & Patrimonio Cultural». La ponencia estuvo a cargo del profesor Salvador Ros y los investigadores Maurizio Toscano y Aroa Rabadán, que presentaron los primeros resultados de la investigación “Impacto de las Humanidades Digitales en España: investigadores, centros, producción científica y financiación”, en el marco del proyecto H2020 DESIR-DARIAH.

En la presentación se destacaron la metodología utilizada para la investigación y los primeros resultados de la elaboración de los datos. En particular, la visualización ponderada de la contribución de las diferentes áreas temáticas a la disciplina, la distribución y concentración de investigadores en los diferentes centros así como una primera aproximación al reparto de la financiación pública y privada en proyectos de investigación en Humanidades Digitales.

El estudio completo se presentará en noviembre, en la reunión anual de DESIR-DARIAH, en Zagreb.

Más información sobre el Congreso de Humanidades Digitales Hispánicas:

https://eventos.uclm.es/24964/detail/iv-congreso-internacional-de-la-asociacion-de-humanidades-digitales-hispanicas.html

Enlace al programa.

POSTDATA en el curso de Procesamiento del Lenguaje Natural organizado por Saturdays.ai Madrid

El pasado sábado, 19 de octubre, el equipo de POSTDATA participó en una sesión sobre Procesamiento del Lenguaje organizada por Saturdays.ai Madrid.

En dicha sesión se presentaron algunas herramientas para la ejecución de PLN, y los alumnos pudieron realizar ejercicios prácticos utilizando el procesador de datos textuales SpaCy.

A continuación, Elena González-Blanco, investigadora principal de POSTDATA, presentó el contenido general del proyecto: el análisis, clasificación y publicación de la poesía aplicando metodologías de análisis propias de las Humanidades Digitales para dar solución a los problemas de interoperabilidad entre las diferentes colecciones poéticas.

Por su parte, Javier de la Rosa y Álvaro Pérez, investigadores del proyecto, presentaron la herramienta PoetryLab del proyecto. Javier explicó en detalle los objetivos del PoetryLab, tanto a nivel analítico como de interoperabilidad, detallando las soluciones a las que se había llegado y su integración en una API común. Álvaro, por su parte, presentó los desafíos que conlleva desarrollar una herramienta así, y lo difícil que resulta tratar con las sutilezas propias del lenguaje poético. Finalmente, presentaron una demo de la API pública y la interfaz web de usuario.

Desde LINHD, agradecemos a los organizadores de Saturdays.Ai Madrid, Pablo Castañeda y Carmen Vázquez de Castro por invitarnos a participar en esta jornada dedicada a la lingüística computacional.

Sobre Saturdays.ai Madrid:

Saturdays AI Madrid forma parte del movimiento #AISaturdays, una iniciativa sin ánimo de lucro que fomenta la formación en Inteligencia Artificial, organizando cursos de contenido práctico y colaborativo sobre esta disciplina.

Más información en: https://www.saturdays.ai/

#AISaturdaysES #POSTDATA

 

POSTDATA asiste al Congreso Anual de CLARIN

Del 30 de septiembre al 3 de octubre tuvo lugar en Leipzig, el Congreso Anual de CLARIN. Se trata del evento más importante del año para los investigadores y profesionales que trabajan en la construcción y funcionamiento de CLARIN en toda Europa.

Asistieron al Congreso dos miembros del equipo POSTDATA: Salvador Ros, Director Técnico y Leire Leguina, Project Manager. Allí tuvieron la oportunidad de intercambiar ideas y experiencias con varios miembros de la comunidad CLARIN, con el fin de crear nuevas sinergias y compartir datos, herramientas y servicios que se incluyen en la Infraestructura CLARIN.

Entre las diferentes intervenciones y ponencias presentadas, destacaron el profesor Scott Rettberg (Universidad de Bergen, Noruega) con su conferencia: Electronic Literature: Documenting and Archiving Multimodal Computational Writing, y la profesora Elke Teich (Universidad del Sarre, Saarbrücken, Alemania), que presentó su trabajo Corpus-Driven Investigation of Language Use, Variation and Change.

El Congreso ha sido organizado por CLARIN ERIC en colaboración con la Universidad de Leipzig y el InfAI – Institut für Angewandte Informatik.

Programa completo de la Conferencia:  https://www.clarin.eu/content/programme-clarin-annual-conference-2019

Website de CLARIN: https://www.clarin.eu/

Presentación de POSTDATA en DH 2019: «Towards a common poetry model: challenges and solutions»

Este paper, presentado en DH2019, se basa en el análisis de múltiples recursos poéticos disponibles en línea, así como en los resultados de las discusiones metodológicas con estudiosos de la literatura europea. El objetivo es recuperar las necesidades de información de las diferentes fuentes para construir un modelo de datos común para la Poesía Europea. Así, mediante la aplicación de un método de ingeniería inversa, se ha creado el Modelo de Dominio para la Poesía Europea, que es un hito importante para hacer interoperables los recursos poéticos existentes. En este trabajo se presentarán algunos de los desafíos que se han encontrado al realizar una conceptualización de la información relevante para el análisis poético y le modo de trabajo en torno a ellos.

Resumen: https://doi.org/10.5281/zenodo.3335509

Presentación: https://doi.org/10.5281/zenodo.3337805

Elena González-Blanco, IP de Postdata, hablará de inteligencia artificial, tecnologías del lenguaje y poesía en una sesión de Techtalk dedicada a Inteligencia Artificial

«Inteligencia artificial y lenguaje: ¿llegarán las máquinas a hablar como los hombres?»

La inteligencia artificial está ahora mismo en boca de todos, y sin embargo es una disciplina cuyos algoritmos comenzaron a desarrollarse hace más de cuatro décadas. En los años 50, Alan Turing planteaba el juego de la imitación preguntándose cuándo una máquina sería capaz de confundirse en una conversación con una persona ¿cuánto nos queda para llegar hasta ese momento? ¿hasta dónde ha llegado la tecnología y cuáles son los retos? ¿cuáles son las principales aplicaciones al negocio y al mundo real? ¿cómo cambiará el futuro cercano?

«El cuadro de las redes neuronales artificiales»

Las redes de neuronas se han convertido en una pieza clave en el proceso de aprendizaje automático (Machine Learning) pero ¿para qué sirven? ¿cuántos tipos hay? ¿Cómo empiezo? ¿Qué caracteriza a cada una? En esta charla aprenderás los conceptos básicos y los variopintos casos de uso como reconocer un idioma, jugar a la NES o pintar un Van Gogh.

Inscríbete aquí

 

PROGRAMA

18:30 Bienvenida y recepción de los asistentes

19:00 Elena Gonzalez-Blanco: Inteligencia artificial y lenguaje: ¿llegarán las máquinas a hablar como los hombres?

19:30 Nerea Luis: El cuadro de las redes de neuronas artificiales

20:15 Cervecitas, picoteo y networking

 

FECHA Y HORA

mar. 11 de junio de 2019

18:30 – 20:30 CEST

112 Calle del Príncipe de Vergara

28002 Madrid

 

BIOGRAFÍAS

Elena González-Blanco

Elena González-Blanco es la General Manager de Europa en Coverwallet. Especialista en el ámbito de la tecnología lingüística, ha sido Responsable de Desarrollo de Producto en Inteligencia Artificial de Minsait-Indra y es además una Investigadora de reconocido prestigio internacional, que lidera POSTDATA, proyecto de investigación europeo de excelencia ERC sobre poesía y web semántica. Fue la directora y fundadora del primer Laboratorio de Innovación en Humanidades Digitales en español: www.linhd.es., y miembro de varios comités científicos europeos. Es Doctora en Filología Hispánica y 1º Premio Nacional de Licenciatura en Hispánicas y Clásicas. Máster en Bibliotecas Digitales de la UC3M, ha sido docente e investigadora en Harvard University, King’s College, UNAM y Bonn. Elegida número #1 en el Ranking Choiseul 2018 «Líderes Económicos del futuro de España, ha sido seleccionada como una de las Top 100 mujeres de España en las ediciones del año 2016, 2017 y 2018 del certamen www.lastop100.es y ha sido galardonada con el premio de investigación Julián Marías 2017 en la categoría de menores de 40 años. Habla inglés, francés, alemán e italiano y es madre de 4 hijos.

https://www.linkedin.com/in/elena-gonzalez-blanco/

Nerea Luis Mingueza

Graduada en Informática en 2013, y Master en 2014 en Computer Science and Technology por la Universidad Carlos III de Madrid. Actualmente finaliza sus estudios de doctorado en la Carlos III. Es un activa y premiada divulgadora y comunicadora científica. En 2016 obtuvo el premio Google Anita Borg, por sus iniciativas tecnológicas llevadas a cabo de forma altruista en paralelo a su carrera académica. Entre ellas se encuentra T3chFest, evento de divulgación tecnológica de la UC3M que además promueve y resalta la falta de diversidad en dicho sector. En 2018 la Fundación COTEC la seleccionó como experta en Tecnología, Talento y Género dentro de su red “Los 100 de Cotec”. Ese mismo año fue seleccionada como técnico de asesoramiento científico, en la iniciativa Ciencia en el Parlamento promovida por el Congreso de los Diputados. También en 2018 ha sido ganadora del reconocimiento Innovadoras TIC por la Fundación Cibervoluntarios. Recientemente, el medio Business Insider la ha reconocido como uno de los 23 talentos menores de 35 años dispuestos a liderar la revolución tecnológica.

https://www.linkedin.com/in/nerealuis/