Entrevista a Elena González-Blanco en Expansión: ¿A qué empresas puede ayudar la inteligencia artificial?

Elena González-Blanco, General Manager of Europe en Coverwallet e Investigadora Principal de POSTDATA, ha sido entrevistada por el periódico económico Expansión, dentro de su serie de entrevistas a mujeres directivas y emprendedoras “Hablemos de futuro”. Elena ha participado en una conversación con Cristina San José, CDO del Grupo Santander, en la que han hablado de la oportunidad que supone la Inteligencia Artificial para el desarrollo de negocio de las empresas españolas.

Entrevista completa disponible en:

https://hablemosdefuturo.expansion.com/a-que-empresas-puede-ayudar-la-inteligencia-artificial

 

 

Número especial de la Revista de Poética Medieval sobre los repertorios poéticos digitales, coordinado por Elena González-Blanco y Helena Bermúdez

La Revista de Poética Medieval acaba de publicar su nuevo número titulado “Los repertorios poéticos digitales: del Medievo a la interoperabilidad”.

Este monográfico, coordinado por las profesoras Elena González-Blanco y Helena Bermúdez, se centra en los recursos poéticos on-line y los diferentes métodos computacionales aplicados al estudio de la poesía.

 La Edad Media es el período en el que se centran la mayor parte de los repertorios digitales de poesía. Dichos repertorios permiten ver cómo cada país, tradición filológica y género literario ha seguido una evolución independiente y particular. Como resultado de ello, el acceso en línea a las colecciones de poesía está muy fragmentado, provocando un problema de incomunicación interlingüística. Sin embargo, gracias a la tecnología y a la inclusión de los big data y de los algoritmos se puede abordar esta problemática desde un punto de vista digital, haciendo que los propios datos en los que los ordenadores convierten a los textos y a los corpus permitan volver a hacer estas tradiciones «interoperables».

Este monográfico de La Revista de Poética Medieval presenta algunos de los repertorios digitales que recogen la variedad, riqueza y singularidad de la poesía medieval europea a través de sus diferentes evoluciones.

Esta es también la perspectiva que se aborda en el proyecto europeo de investigación Poetry Standardization and Linked Open Data (POSTDATA), en cuyo marco se desarrolla el contenido de este monográfico.

Para más información:

https://recyt.fecyt.es/index.php/revpm

 

Sobre Revista de Poética Medieval:

Fundada en 1997, la Revista de Poética Medieval es una publicación anual dedicada al estudio de la poética y a la reflexión teórica y crítica sobre la literatura medieval hispánica e internacional. Sus páginas están abiertas a investigaciones originales de alta calidad científica. La Revista de Poética Medieval provee acceso libre a su contenido y está indexada en numerosas bases de datos que garantizan la alta calidad de la publicación como Latindex o ERIH Plus.

Nueva herramienta desarrollada por el equipo de POSTDATA para spaCy

En POSTDATA usamos la librería de procesamiento de lenguaje natural para Python, spaCy. Se está convirtiendo en un estándar en la industria, pero, aunque generalmente funciona bien, todavía hay que pulir un poco el soporte para español.
Un problema que nos surgió con esta librería fue que no detecta bien los pronombres clíticos (por ejemplo, en palabras como «dímelo», «piérdete» o «hazme»). Esto se debe a que spaCy usa un modelo de datos para español que no ha sido entrenado de manera apropiada para este tipo de palabras.
Para solucionar este problema hemos estado trabajando en una extensión para spaCy que nos permite una identificación y separación apropiada, tanto de la palabra raíz, como de sus sufijos. Esta herramienta open source ha sido liberada y se puede instalar muy fácilmente desde python con un simple «pip install spacy_affixes». En la página de github del proyecto se puede encontrar toda la documentación necesaria:

https://github.com/linhd-postdata/spacy-affixes

¿Cómo funciona?
El funcionamiento es muy simple: nos bajamos archivos de reglas para afijos (que obtendremos de la herramienta Freeling http://nlp.lsi.upc.edu/freeling/index.php/node/1 ) y tras implementar sus reglas en python, añadimos este nuevo comportamiento al «pipeline» (el flujo de trabajo) de spaCy. Gracias a esto obtenemos unos resultados mucho más precisos de los que obtiene spaCy en esta tarea. Es una pieza clave de las herramientas desarrolladas por el equipo de POSTDATA dentro de la suite de PoetryLab y nos enorgullece mucho poder liberarla y compartirla con el resto de la comunidad NLP. Es nuestro granito de arena en un campo en el que hay tan pocos recursos libres para español, como es el de procesamiento del lenguaje natural.

 

Presentación de la investigación H2020 DESIR-DARIAH «Digital Humanities Research in Spain»

El Laboratorio de Innovación en Humanidades Digitales y POSTDATA han participado en la Asamblea General de DARIAH, celebrada en Zagreb los días 6 y 7 de noviembre. En dicha asamblea se han presentado los resultados preliminares del proyecto H2020 DESIR-DARIAH «Digital Humanities Research in Spain».

La investigación, coordinada por Salvador Ros, ha sido desarrollada por los investigadores Maurizio Toscano y Aroa Rabadán. En la presentación se ha destacado la metodología empleada por ambos investigadores, que incluye datos referidos a los investigadores, proyectos, recursos, revistas y formación en HD siguiendo diferentes líneas temáticas como su distribución geográfica, líneas de investigación frecuentes y la financiación obtenida por los proyectos en España. De especial interés ha sido la exposición de datos como el número de investigadores en HD con respecto a su género—hombres (51 %) y mujeres (49 %)—y la proporción de todos ellos en relación a los investigadores de las Humanidades genéricas—hombres (58%) y mujeres (42 %)—en el año del último estudio realizado (2016).

El estudio completo se presentará en un informe donde se recogerán todos estos datos revisados y ampliados.

 Más información sobre el estudio en: DARIAH-EU.

POSTDATA en el curso de Procesamiento del Lenguaje Natural organizado por Saturdays.ai Madrid

El pasado sábado, 19 de octubre, el equipo de POSTDATA participó en una sesión sobre Procesamiento del Lenguaje organizada por Saturdays.ai Madrid.

En dicha sesión se presentaron algunas herramientas para la ejecución de PLN, y los alumnos pudieron realizar ejercicios prácticos utilizando el procesador de datos textuales SpaCy.

A continuación, Elena González-Blanco, investigadora principal de POSTDATA, presentó el contenido general del proyecto: el análisis, clasificación y publicación de la poesía aplicando metodologías de análisis propias de las Humanidades Digitales para dar solución a los problemas de interoperabilidad entre las diferentes colecciones poéticas.

Por su parte, Javier de la Rosa y Álvaro Pérez, investigadores del proyecto, presentaron la herramienta PoetryLab del proyecto. Javier explicó en detalle los objetivos del PoetryLab, tanto a nivel analítico como de interoperabilidad, detallando las soluciones a las que se había llegado y su integración en una API común. Álvaro, por su parte, presentó los desafíos que conlleva desarrollar una herramienta así, y lo difícil que resulta tratar con las sutilezas propias del lenguaje poético. Finalmente, presentaron una demo de la API pública y la interfaz web de usuario.

Desde LINHD, agradecemos a los organizadores de Saturdays.Ai Madrid, Pablo Castañeda y Carmen Vázquez de Castro por invitarnos a participar en esta jornada dedicada a la lingüística computacional.

Sobre Saturdays.ai Madrid:

Saturdays AI Madrid forma parte del movimiento #AISaturdays, una iniciativa sin ánimo de lucro que fomenta la formación en Inteligencia Artificial, organizando cursos de contenido práctico y colaborativo sobre esta disciplina.

Más información en: https://www.saturdays.ai/

#AISaturdaysES #POSTDATA

 

Entrevista a Elena González-Blanco en MasQUEUNAradio

Elena González-Blanco, investigadora principal de POSTDATA, ha sido entrevistada en MasQUEUNAradio, para hablar de su trayectoria y experiencia en Inteligencia Artificial. así como del uso de las nuevas tecnologías aplicadas a las Humanidades. También ha comentado su proyecto europeo de humanidades digitales POSTDATA, financiado por el Consejo Europeo de Investigación (CEI) en el marco del programa de investigación e innovación Horizonte 2020 de la Unión Europea.

Utilice el siguiente enlace para acceder al programa https://www.pscp.tv/w/1lDxLoDNyyPJm

Elena González-Blanco, IP del Proyecto Europeo POSTDATA participa en el encuentro sobre Voz humana e Inteligencia Artificial, organizado por la Fundación Telefónica.

El pasado 17 de septiembre se celebró en el Espacio Telefónica de Madrid el encuentro “La voz nos distingue como humanos”, que sirvió para presentar el nuevo número de la Revista Telos, centrado en las aplicaciones de la voz para el desarrollo tecnológico, y en la importancia de la voz en una sociedad cada vez más digital.

En el encuentro participaron Juliana Rueda, ingeniera de sonido, productora de audiolibros, Marta Pinillos, profesora de voz y comunicación no verbal y Elena González-Blanco, directora general de Europa en CoverWallet. Moderó el debate Juan M. Zafra, director de la Revista Telos y profesor de Periodismo en la Universidad Carlos III de Madrid.

La relación entre la voz y la Inteligencia Artificial avanza a pasos agigantados pero aún queda camino por recorrer. En palabras de Elena González: “Queda muchísimo por hacer para que las voces que hemos escuchado se generen solas desde una máquina”. “Traducir los sentimientos humanos para que los algoritmos y las máquinas los reproduzcan en la voz es lo verdaderamente difícil. […] Pero con el suficiente número de datos y entrenamiento, podemos llegar a un grado de exactitud en la imitación de voces bastante alto“.

Artículo de Elena González-Blanco en la Revista Telos: “En el corazón de la encrucijada”:
https://telos.fundaciontelefonica.com/telos-111-cuaderno-la-voz-elena-gonzalez-blanco-inteligencia-articial-tecnologias-lenguaje-en-el-corazon-de-la-encrucijada/

Video completo de la presentación:

Entrevista a Elena González-Blanco en Fundación Telefónica:

Presentación de POSTDATA en DH 2019: «Towards a common poetry model: challenges and solutions»

Este paper, presentado en DH2019, se basa en el análisis de múltiples recursos poéticos disponibles en línea, así como en los resultados de las discusiones metodológicas con estudiosos de la literatura europea. El objetivo es recuperar las necesidades de información de las diferentes fuentes para construir un modelo de datos común para la Poesía Europea. Así, mediante la aplicación de un método de ingeniería inversa, se ha creado el Modelo de Dominio para la Poesía Europea, que es un hito importante para hacer interoperables los recursos poéticos existentes. En este trabajo se presentarán algunos de los desafíos que se han encontrado al realizar una conceptualización de la información relevante para el análisis poético y le modo de trabajo en torno a ellos.

Resumen: https://doi.org/10.5281/zenodo.3335509

Presentación: https://doi.org/10.5281/zenodo.3337805

LINHD y POSTDATA participan en la III Reunión anual del proyecto coordinado Poder y Representaciones: Transferencias culturales en la Época Moderna

El Laboratorio de Innovación en Humanidades Digitales (LINHD) y el proyecto  POSTDATA participan en la III Reunión anual del proyecto coordinado Poder y Representaciones: Transferencias culturales en la Época Moderna que tuvo lugar en el Museo Arqueológico Nacional  el día 18 de mayo de 2019 y que ha sido organizada por el proyecto Poder i Representacions. Transferències culturals a l’Època Moderna de la UNED y de la Universidad de Barcelona.

Mª Luisa Díez Platas, investigadora del proyecto, realizó el Taller: La aplicación de las herramientas digitales al estudio de las redes en la Monarquía de España». En este taller se hizo un recorrido por las actividades y desarrollos llevados a cabo en LINHD y POSTDATA y su aplicabilidad al estudio de las redes  de la Monarquía y otros proyectos de humanidades digitales.

En el resto de la jordana tuvo lugar una sesión introductoria acargo de Alejandra Osorio (Wellesley College) sobre   La Monarquía de España en la Edad Moderna: nudos, redes y conectores. Algunas perspectivas.  y una mesa redonda, moderada por Joan-Lluís Palos (UB) sobre La teoría de las redes sociales y su aplicación al estudio de la Monarquía de España.

LINHD y POSTDATA agradecen especialmente al Dr. Joan-Lluís Palos y a la Dra. Diana Carrió-Invernizzi por su invitación para impartir el taller y por la posibilidad de dar a conocer el Laboratorio de Innovación en Humanidades Digitales y el proyecto POSTDATA a los investigadores del proyecto.

 

 

DARIAH Annual Event 2019: Humanities Data

Salvador Ros asiste a la conferencia anual de DARIAH. La presencia de los grupos españoles ha sido notoria gracias a las acción dirigida desde el proyecto Desir que tienen como objetivo impulsar la adhesion de España en Dariah.
Linhd lidera con el apoyo de los investigadores españoles esta iniciativa que es es de todos y para todos. En esta conferencia queda claro la necesidad de la formación en el uso de las tecnologías , en este sentido LINHD esta comprometido y apoya esta iniciativas como el curso de verano Creando un proyecto de Humanidades Digitales usando el modelado de datos y el procesamiento de textos que se  llevará a cabo entre los días 1 y 3 de julio de 2019 en la UNED. 

Este año, el curso DH@Madrid Summer School se propone que los estudiantes puedan abordar un proyecto de humanidades digitales, centrado en textos, desde su inicio. Se comenzará con un modelado del dominio definiendo una ontología orientada a datos enlazados (LOD) para seguir con la generación de código que resuelva o ayude a resolver las preguntas de investigación. Se hará uso de los nuevos paradigmas computacionales relacionados con técnicas que provienen del mundo de la Inteligencia Artificial en su sentido más amplio (procesamiento de textos, deep learning, etc.). Finalmente, se realizarán ejercicios para representar los resultados.

Ya está abierto el plazo para matricularte, puedes obtener más información pinchando aquí.