
- Día: 20 de abril de 2026
- Lugar: Salón de Grados, Facultad de Educación, Calle Juan del Rosal, 14, 28040 – Madrid Mapa
- Contacto: info@linhd.uned.es
El estudio de la prensa histórica constituye uno de los campos más fértiles y a la vez más complejos para la investigación interdisciplinar con metodologías digitales. La prensa es una fuente privilegiada para comprender los discursos, valores, gustos, redes intelectuales y dinámicas sociales de comunidades, con lo que apela a la investigación relacionada con la historia, literatura, traducción, geografía, economía, música o la sociología. Sin embargo, su investigación presenta varios retos metodológicos, como son el volumen de material, su dispersión, la necesidad de conocimiento contextual para comprender el contenido y la precaria preservación de muchas cabeceras.
En los últimos años, la digitalización de prensa histórica realizada por numerosas instituciones y proyectos ha ampliado de manera notable el acceso a estos materiales. Sin embargo, su exploración computacional aun presenta retos importantes. Gran parte de las colecciones no dispone de texto transcrito automáticamente mediante reconocimiento óptico de caracteres (OCR, por sus siglas en inglés), y las propias características de los periódicos y de las revistas (columnas, elementos gráficos, anuncios, fragmentación de noticias en varias páginas, serializaciones narrativas o tipografías deterioradas) dificultan los procesos de transcripción y de análisis automático. Aun así, el panorama europeo muestra avances significativos. Las infraestructuras de investigación europeas CLARIN y DARIAH están abordando estos retos a través de proyectos como NewsEye o iniciativas en Austria y Finlandia, que están mejorando de forma sustancial el tratamiento computacional de la prensa histórica.
No obstante, persiste un vacío notable en nuestro contexto: aunque CLARIN alberga varios corpus de prensa histórica en diversos idiomas europeos, todavía no cuenta con colecciones en español ni en otras lenguas oficiales de España. Con el ánimo de afrontar estos retos e intercambiar ideas sobre la investigación en prensa histórica desde las humanidades y desde las ciencias computacionales, tanto en español como en el resto de las lenguas del Estado, dos nodos de la red estratégica CLARIAH-ES que trabajan en proyectos de prensa histórica GRESEL-UNED (coordinado desde CLARIAH-UNED) y PressMint-ES (coordinado por HiTZ/CLARIAH-EUS), organizan este simposio en el que se propone explorar las siguientes líneas:
- Digitalización y exploración de fondos hemerográficos: OCR, segmentación de columnas, reconstrucción de seriales, metadatos.
- Procesamiento lingüístico y análisis semántico: extracción de entidades, análisis de tópicos, reconocimiento de autoría, análisis del discurso.
- Inteligencia artificial aplicada a corpus históricos: entrenamiento de modelos específicos para la prensa; detección automática de géneros, ironía o autoría, creación de RAGs para la exploración de prensa histórica.
- Proyectos de corpus multilingües y diversidad lingüística: estudios sobre prensa histórica en todas las lenguas del Estado español.
- Exploración geográfica y social: cartografías de circulación, estudios de redes periodísticas, geografías culturales.
- Historia y literatura: usos de la prensa como espacio de intermediación cultural y mediación literaria.
- Sesgos e ideología en la prensa y su exploración con inteligencia artificial.
Pronto publicaremos el programa.