POSTDATA presente en la conferencia inaugural EADH 2018: “Datos en las Humanidades Digitales” en la Universidad Nacional de Irlanda

La Asociación Europea de Humanidades Digitales (EADH) celebró su primera conferencia anual relacionada con el tema general de “Datos en las Humanidades Digitales” en la Universidad Nacional de Irlanda, Galway del 7 al 9 de diciembre de 2018.

Entre los conferencistas participaron Elisabeth Burr (Universidad de Leipzig) y Vladimir A. Plungian (Academia Rusa de Ciencias). Una sesión de mesa redonda sobre el tema de los datos y las humanidades digitales fue presidida por Christof Schöch.

Salvador Ros Muñoz, Director Técnico de POSTDATA en la UNED, presentó los avances del proyecto.

Link al programa completo

POSTDATA en televisión española

Elena Gonzalez-Blanco y Salvador Ros Muñoz participaron del ciclo te televisión educativa que comparten la 2 y la UNED.

El programa se ha emitido el viernes 30 de noviembre en la 2 en el programa semanal que difunde RTVE junto a la Universidad.

El mismo se enmarca en la Jornada de Inteligencia Artificial “Thinking Party”, de la que Elena Gonzalez-Blanco ha participado como panelista y en la muestra “Nosotros, Robots“, realizadas ambas en el Espacio Fundación Telefónica.

La jornada “Thinking Party”, realizada el 25 de octubre, ha centrado su contenido en dos ejes fundamentales que vertebran el debate sobre los usos de la Inteligencia Artificial: sus aplicaciones relacionadas con la creatividad y el conocimiento, desde la perspectiva humanística, y sus implicaciones éticas y legales.

Por su parte, la muestra “Nosotros, Robots”, reflexiona, a través de una selección de cerca de cincuenta robots, sobre los retos a los que se enfrenta la humanidad ante el desarrollo imparable de estas máquinas, y, además, sobre las posibilidades que ofrecen para transformar el futuro. La muestra, comisariada por el escritor y analista Andrés Ortega y, organizada en colaboración con Casual Robots, puede verse en la tercera planta de Espacio Fundación Telefónica, del 5 de octubre de 2018 al 3 de febrero de 2019.

 

Durante el programa, Elena Gonzalez-Blanco y Salvador Ros Muñoz exploran el panorama actual respecto a la robótica y la inteligencia artificial centrándose en el sector educativo como eje del reportaje.

 

Link al programa completo https://www.youtube.com/watch?v=pUzRiebuROQ

Celebrado el Workshop conjunto de la Infraestructura de investigación DARIAH y el proyecto DESIR en la UNED

Este 30 de octubre se realizó en la UNED el Workshop DARIAH-DESIR, un taller sobre infraestructuras digitales en España. El evento fue organizado por el proyecto H2020 DESIR -DARIAH desde el Laboratorio de Humanidades Digitales (LINHD-UNED) y con el apoyo del proyecto POSTDATA. Participaron como organizadores colaboradores la Asociación de Humanidades Hispánicas (HDH) y el Grupo de Investigación (HDCICuba).

El workshop contó con las palabras inaugurales del Rector Magnífico de la UNED Dr.D. Ricardo Mairal Usón, y de Dr. D.Salvador Ros Muñoz, investigador principal del proyecto DESIR. Participaron como invitados Dr. D. Toma Tasovac, Director del Belgrade Center for Digital Humanities y Director de DARIAH, Dña Inmaculada Figueroa, subdirectora general adjunta de Internacionalización de la Ciencia e Innovación del Ministerio de Ciencia, Innovación y Universidades, el Dr. Koendraad De Smedt, Coordinador Nacional de CLARIN en Noruega y el Dr. Oriol Vicente Campos, Coordinador de la Xarxa Humanitats Digitals de la UAB.

El workshop tuvo tres objetivos. Primero dar a conocer la infraestructura Europea para las humanidades Digitales DARIAH; segundo presentar a nivel internacional las infraestructuras digitales españolas y tercero discutir algunas estrategias de cooperación entre el Ministerio y los diversos grupos de investigación relacionados con las Humanidades Digitales en España y su adhesión a DARIAH.


Actualmente España no se ha incorporado de forma definitiva a DARIAH pero participa en ella a través del proyecto DESIR que lidera la UNED y que convierte a la institución, en el único socio español de la red internacional. El objetivo de DESIR es impulsar las infraestructuras de DARIAH y fomentar la integración total de nuestro país en la red, para lo cual está comenzando a trabajar con el Ministerio y con los grupos de investigación y redes profesionales de las Humanidades Digitales para coordinar los proyectos existentes y definir una estrategia conjunta que culmine con la integración de España en DARIAH.

El programa se dividió en dos sesiones. En la mañana se realizaron las presentaciones de las Infraestructuras internacionales DARIAH y CLARIN, las del Incipit, CSIC, así como de infraestructuras profesionales como la Asociación de Humanidades Digitales Hispánicas (HDH) y la Xarxa Humanitats Digitals (XDH) de la Universidad Autónoma de Barcelona.

El Ministerio de Ciencia, Innovación y Universidades, en palabras de Inmaculada Figueroa, Subdirectora General Adjunta de Internacionalización de la Ciencia e Innovación, está abierto a la participación de España en DARIAH. Refiriéndose a los primeros intentos en 2014-2015, expresó “cuando se inició el proceso se consideró que España tenía que estar en DARIAH por su naturaleza y por sus recursos.

DARIAH también quiere a España adentro”. Figueroa remarcó el trabajo realizado por la UNED y la Asociación de Humanidades Digitales en aquel entonces donde convocaron a 40 grupos de diferentes instituciones interesados en participar de esa infraestructura europea.

 

En la tarde el workshop sesionó en plenario, con la conducción de Salvador Ros (DESIR), Nuria Rodríguez Ortega (HDH), Oriol Vicente (XHD), para la discusión de las intenciones de participación española en la infraestructura DARIAH. El auditorio, compuesto por profesores e investigadores de varias universidades del país, acordaron trazar una estrategia de trabajo conjunta, con el liderazgo de la HDH, que permita incrementar el número de interesados y organizar las actividades en camino a la incorporación de
España a DARIAH.

 

El evento contó con 30 participantes de forma presencial y 103 en línea. Los vídeos pueden verse de forma diferida en el sitio web de la UNED el link para el diferido: https://bit.ly/2yXSBtc

 

Noticias relacionadas:

a UNED acoge un taller sobre infraestructuras digitales en España
https://bit.ly/2zC9ZDs
Workshop DARIAH: digital infrastructures in Spain https://bit.ly/2FdiECq

Autora: Sulema Rodríguez Roche

 

 

 

 

Jornada de Inteligencia Artificial “Thinking Party”

La jornada “Thinking Party”, se realizó el 25 de octubre, en el Espacio Fundación Telefónica, Madrid. Ha centrado su contenido en dos ejes fundamentales que vertebran el debate sobre los usos de la Inteligencia Artificial: sus aplicaciones relacionadas con la creatividad y el conocimiento, desde la perspectiva humanística, y sus implicaciones éticas y legales.

Para ello, ha contado con una de las mayores expertas y divulgadoras en la materia, la investigadora británica Margaret Boden, que explora las relaciones entre humanos e inteligencia artificial de cara al futuro y con la intervención de Chema Alonso, Chief Data Officer de Telefónica. Para hablar sobre humanismo, lenguaje y conocimiento ha sido invitada Elena González Blanco, directora general de CoverWallet, junto a otras especialistas como Claudia Giannetti, David del Val y Pablo Gervás, mientras que la perspectiva ética, Natalia Martos, Elena Valderrábano y Moisés Barrio.

Asimismo, ha tenido lugar la presentación de casos prácticos por parte de representantes de IBM y la agencia de comunicación Prodigioso Volcán. El evento ha tenido su broche final gracias a las intervenciones innovadoras de Alberto Levy y la performance de #MúsicaBiotrónica del artista Ain
TheMachine.

Fotos cortesía de Fundación Telefónica

Autora Irene Medina (@ireneml en IG e @imedlo)

El proyecto Postdata en la Conferencia Anual de CLARIN

La Conferencia Anual de CLARIN fue organizada CLARIN ERIC, en colaboración con el Instituto de Lingüística Computacional (ILC) que forma parte del Departamento de Ciencias Sociales y Humanidades, Patrimonio Cultural (DSU) del Consejo Nacional de Investigación de Italia (CNR)

CLARIN2018 tuvo como objetivo intercambiar ideas y experiencias acerca del funcionamiento y servicios de CLARIN, así como su utilidad por parte de la comunidad de investigadores y su relación con otras infraestructuras y proyectos.

Del encuentro han participado Elena González-Blanco, directora general de CoverWallet en Europa e Investigadora principal de POSTDATA y Salvador Ros, Coordinador del proyecto DESIR y coordinador técnico de POSTADATA. Los principales resultados y herramientas del proyecto se han presentado durante el evento https://zenodo.org/record/1465501#.W8m8a0szbIU .

Las herramientas de poesía están destinadas a ser un mercado de código abierto donde se encuentran diferentes herramientas para procesar poesía desde la detección del modelo de poesía hasta procesos semánticos más complejos. Pero no solo está dedicado a los procesos de poesía, sino a cualquier proceso que mejore y permita una comprensión más profunda de la misma.

Las herramientas de POSTDATA que fueron presentadas son ANJA y HISMETAG. Una está relacionada con el concepto de enjambment y la segunda está relacionada con el reconocimiento de las entidades nombradas en los textos medievales.

Para más información del proyecto POSTDATA podéis visitar:

http://postdata.linhd.uned.es

 

 

Postdata en la Conferencia anual de la Iniciativa de Metadatos Dublin Core

La Conferencia anual Internacional de la Iniciativa de Metadatos Dublin Core (DCMI), ha sido este año organizada por la Universidad de Oporto del 10 al 13 de septiembre en Portugal.

POSTDATA ha participado de la conferencia presentando el artículo “Validation of a metadata application profile domain model”.

El artículo completo se puede leer aquí.

La Iniciativa de Metadatos Dublin Core es una organización que ha surgido de una sucesión de talleres o reuniones de trabajo que, desde 1995, tienen el objetivo de encontrar una estrategia común para la localización y recuperación de recursos electrónicos en la web.

Para ver el programa de la conferencia 2018: http://dublincore.org/conference/2018/programme/

Crónica del curso de verano DH@Madrid Summer School 2018

Bajo el título Aplicaciones y posibilidades del procesamiento del Lenguaje Natural para la Investigación en Humanidades por quinto año consecutivo, DH@Madrid Summer School 2018 ha tenido lugar en la UNED en su emblemático salón de actos Andrés Bello.

Durante los tres días de curso, se ha propuesta una introducción al Procesamiento del Lenguaje Natural centrado en su aplicación a los problemas propios de la investigación en Humanidades Digitales. De esta manera, el curso se ha dirigido a todos aquellos interesados en métodos digitales de investigación aplicados a las humanidades.

Nuevamente en esta oportunidad, los contenidos del curso, han podido seguirse de forma presencial y online, y ya se puede acceder en diferido.

Esta nueva edición del curso de verano ha contado entre otras, con la colaboración de las infraestructuras europeas de investigación CLARIN y DARIAH, así como de distintas redes de humanidades digitales, y ha sido organizado por el LINHD en el marco del proyecto POSTDATA.

DH@Madrid 2018

El lunes comenzó con la bienvenida y la presentación del curso por parte de los directores, Clara I. Martinéz Cantón y Salvador Ros Muñoz.

A continuación, Elena Álvarez Mellado, nos deleitó con su ponencia de “La lengua al microscopio: introducción básica al NLP desde Humanidades”, explicando las posibilidades que permiten las herramientas de la Lingüística computacional, mediante el análisis informático de grandes cantidades de textos. Su ponencia ha comenzado con una comparación entre el tabú que existía en época medieval en relación a la disección de cuerpos humanos para comprender su funcionamiento, y el peso de la tradición médica de Galeno, cuyas teorías estaban basadas principalmente en la observación, pero no se contrastaban. Explicó, además, las tareas básicas de un ordenador a la hora de procesar un texto.

 

La tarde del lunes se cerró con la presentación de Jennifer Edmond, Directora de proyectos estratégicos del Trinity Long Room Hub Arts & Humanities Research Institute, contándonos sobre la infraestructura DARIAH y de las ventajas de crear y compartir una infraestructura común que nos facilite el acceso a redes de trabajo y al conocimiento compartido entre diversos actores. De esta manera, tener una estructura también permite acercarse y ajustarse mejor a estándares como Open Science, incrementa las posibilidades de obtener financiación y promueve la sostenibilidad a lo largo del tiempo de los resultados. Permite además, estar al día de qué se está haciendo en el entorno de tu investigación.

El día martes, comenzó con la charla de Pablo Ruiz Fabo que ha introducido la noción expresión regular (regular expression- regex) y ha mostrado con diversos ejemplos y ejercicios cómo explorar un corpus de textos mediante el uso de regex, aprendiendo a modificar cadenas de texto eficazmente. La exposición teórica estuvo acompañada de ejercicios en donde se aprendieron, entre otras, las diferencias entre los elementos literales y los especiales. Durante su ponencia Pablo ha proporcionado una serie de enlaces donde poder usar las
expresiones regulares en Internet y también unos editores para poder descargarse en los ordenadores.

Mikel Iruskieta, investigador del Grupo IXA de la Universidad el País Vasco, exponía la potencialidad de Python y el lenguaje de programación para extraer o generar corpora textuales y explotarlos, guardando los resultados obtenidos. También, explicaba las tareas de PLN que pueden realizarse con Python, como la extracción de información de textos de distinto tipo, buscar términos en la web y comparar frecuencias, el desarrollo de programas basados en análisis lingüísticos y búsquedas basadas en diccionarios, guardando toda la información obtenida en XML. Asimismo, explicaba para qué podían ser útiles las infraestructuras del procesamiento del lenguaje, como CLARIN-K.

Por su parte, Mª Luisa Díez Platas, Investigadora del proyecto POSTDATA, se centró en la presentación de una herramienta que ha sido desarrollada en el Proyecto POSTDATA para el reconocimiento de entidades nombradas: Hispanic Medieval Tagger (HisMeTag). Constituye una de las tareas más importantes en la extracción de información y consiste en el reconocimiento y la clasificación de nombres de personas, lugares, organizaciones, expresiones numéricas, expresiones temporales, etc.  Su principal novedad es el reconocimiento de entidades nombradas en textos medievales. Pero, además, gracias a HisMeTag ha sido posible la creación de una taxonomía de entidades que puede servir de gran utilidad para los humanistas en su tarea de análisis de los textos.

La tarde del martes finalizó con la ponencia de Elena González-Blanco, investigadora principal del Proyecto POSTDATA y General Manager of Europe en CoverWallet. Elena comenzó con un repaso de lo que son las Humanidades Digitales y la situación actual, con el machine learning y la inteligencia artificial. Comentó que la inteligencia artificial es una etiqueta que engloba muchas cosas: reconocimiento facial o de escritura; máquinas que pueden llevar a cabo razonamientos complejos, como jugar al ajedrez; algoritmos complejos que se resuelven solos; los chatbots y los asistentes virtuales o los medios de transporte que se conducen solos. Son tecnologías diversas que se aplican a diferentes ámbitos, pero que todas tienen un punto en común: la transformación digital. No es la disciplina la que marca la diferencia, sino la tecnología y el tipo de materia sobre la que se aplica.

El último día de curso, comenzó con la charla de Antonio Robles de la UNED y José Manuel Fradejas de la Universidad de Valladolid. Se puso de manifiesto la necesidad de la interdisciplinariedad, uniendo el aspecto informático con el humanístico. En este sentido, el lenguaje R no solo sirve para el análisis de textos sino también para realizar análisis estadísticos y visualizaciones avanzadas. El profesor Fradejas explicó qué es la estilometría y señaló cuales son los libros reveladores en el campo de la estilometría para él. La charla de José Manuel también tuvo una gran parte de práctica para demostrar otras potencialidades del PLN.

A continuación, Gimena del Río, investigadora de CONICET- Argentina, explicó en qué consistía el proyecto Pelagios, y lo que es un gazetteer (una base de datos histórico-geográfica que permite trabajar en sistemas de información geográfica con coordenadas geotópicas). La estructura Pelagios está centrada en datos geográficos como entidades nombradas y trabaja distintas tecnologías: Linked Open Data, Geographical Information Systems, Natural Language Processing, GeoJson, XML-TEI, etc. Además su uso es muy intuitivo, como se pudo comprobar
durante la práctica.

La intervención de Helena Bermúdez Sabel, investigadora del Proyecto POSTDATA, fue de carácter eminentemente práctico. Comenzó, sin embargo, con una breve introducción sobre en qué consiste XML y sus ventajas respecto a otros formatos, al unir un lenguaje humano y uno informático. Así, la finalidad principal del lenguaje XML es la de modelar la estructura inherente y las propiedades semánticas de diversos documentos culturales por medio de hierarquías y estructuras ordenadas. Entre las aplicaciones prácticas de XML para las Humanidades Digitales cabe destacar la identificación de estrofas y versos y una serie de recursos estilísticos.

Para finalizar y a modo de colofón del curso, Enrique Vidal, catedrático de la Universidad Politécnica de Valencia, explica cómo llevar a la práctica en un proyecto de investigación, el Procesamiento del Lenguaje Natural. Hace algunas décadas numerosos investigadores vaticinaron el fin del papel como modelo de transmisión del texto escrito. Sin embargo, este vaticinio no se cumplió y hoy en día existe una buena cantidad de textos escritos a mano que no han sido procesados aún mediante herramienta informática alguna. Las tecnologías que se están desarrollando actualmente para procesar textos manuscritos son cada día más numerosas. Explicó que se han desarrollado tecnologías de interacción persona-máquina que permiten conseguir transcripciones perfectas con un esfuerzo mucho menor del que supondría una transcripción manual por parte de un ser humano. Estos son los llamados métodos interactivo-predictivos de transcripción asistida. Además, se han desarrollado tecnologías de predicción probabilística de texto en imágenes, que se pueden aplicar directamente a las imágenes sin tenerlas explícitamente transcritas.

¡¡¡Muchas gracias a todos por la participación…los esperamos el año que viene!!

 

New full-time job offers in the POSTDATA ERC project at LINHD, UNED

We are looking for 2 full-time Computational Linguist / Natural Language Processing developers for the ERC research project POSTDATA.

Requirements for this position are:

  • Knowledge of Natural Language processing (NLP) or Computational Linguistics
  • Knowledge of NLP toolkits
  • Experience using language technology in the Humanities
  • Good programming skills in Python or Java
  • Languages: Spanish and English
  • Demonstrable good writing skills in English
  • Experience with software version control (git)
  • Autonomy combined with good communication and collaboration skills, team-oriented

Desirable

  • Experience with machine learning
  • Experience using machine learning for non-canonical language varieties
  • Experience with managing annotation projects
  • Experience with deep learning
  • Knowledge of web development frameworks (e.g. Django or Flask, or Drupal)
  • Additional languages (modern or historical varieties)
  • Good publication record in NLP or related areas
  • Experience with software prototyping
  • Experience with iterative development
  • Linux shell, shell scripting
  • Experience deploying web applications on Linux

Candidates must sent a short CV (maximum 4 pages) and a motivation letter (maximum 2 pages) explaining why they fit for the position, with references to previous projects developed. 

Contact email: luciana@linhd.uned.es

Deadline: 21th September, 2018

Mandatory SUBJECT of email message: POSTDATA Developer Application _ LastName, Name

The positions will be filled as soon as we find a candidate suitable for it. Don’t wait for the last minute!

POSTDATA participa del Congreso de Humanidades Digitales 2018 en Mexico

El congreso DH2018 (Humanidades Digitales 2018) tuvo lugar en la Ciudad de México entre el 26 y 29 de junio, organizado por The Association of Digital Humanities Organizations (ADHO),  El Colegio de México y la Universidad Nacional Autónoma de México (UNAM), en colaboración con la Red de Humanidades Digitales (RedHD). POSTDATA participó en el congreso con una presentación breve y un póster.

Presentamos la nueva versión de nuestro corpus DISCO, que consta de 4.000 sonetos en español de más de 1.000 autores, tanto canónicos como no, de Europa y América, que abarcan desde el siglo XV hasta el siglo XIX. El corpus se proporciona en TEI y texto simple, con diversos metadatos para describir a los autores, en TEI y a través de atributos RDFa (un formato de datos enlazados). El corpus tiene anotaciones literarias obtenidas a través del Procesamiento del Lenguaje Natural, concretamente escansión y encabalgamiento, y puede descargarse libremente aquí. El trabajo presentado se encuentra aquí.

 

También presentamos la interfaz web a ANJA, nuestra herramienta de detección de encabalgamiento en español, accesible aquí. Permite cargar poemas y obtener anotaciones de encabalgamiento según una tipología especializada. El trabajo se describe aquí.

 

¡El congreso fue un gran evento por el que debemos agradecer a la organización!

POSTDATA participa de la Conferencia sobre Ciencia Abierta y las Humanidades en Barcelona

La Ciencia Abierta es una práctica de la ciencia y un movimiento para hacer que la investigación científica, los datos y la difusión sean accesibles a todos los niveles de una sociedad investigadora en términos que permitan la reutilización, redistribución y replicabilidad de la investigación, de los datos y de los métodos subyacentes.

El pasado jueves 21 de Junio tuvo lugar la Conferencia sobre Ciencia Abierta y las Humanidades 2018 en la Universidad de Barcelona. En esta ocasión el Proyecto POSTDATA fue presentado por Luciana Ayciriex, actual Project Manager del proyecto.

La bienvenida estuvo a cargo de  Xavier Roigé Ventura, Vicerector de Doctorat i Promoció de la Recerca, Domènech Espriu Climent, Vicerector de Recerca, Àlex Aguilar Vila, Vicerector de Projecció i Internacionalizació y José Remesal de la Universidad de Barcelona.

POSTDATA: Open poetry, open science and linked open data

La conferencia fue organizada por la Universitat de Barcelona, SIRIS AcademicEP.NET, CEIPAC, ERC

Programa de la conferencia http://www.ub.edu/openscienceandthehumanities/es/programme/