OBJETIVO DEL CURSO

El objetivo del curso es dotar a los investigadores de humanidades de los conocimientos básicos para realizar investigaciones de minería de textos (Text mining), problemas de atribución de autoría, lingüística forense, procesamiento de lenguaje natural, modelado de temas (Topic Modelling) por medio de un lenguaje de programación libre y gratuito ampliamente empleado por la comunidad científica en diversos campos y materias, desde la estadística a la lingüística forense pasando por la filogénesis, bioestadística, análisis político, marketing… Este sistema permite el procesamiento automatizado de grandes cantidades de texto por ordenador, arrojando interesantes datos, que pueden representarse visualmente sobre cuestiones tan relevantes como las distintas manos o autores que intervienen sobre una obra, o la frecuencia de un determinado tipo de palabras o recursos estilísticos para tratar determinados temas. Se trata, sin duda, de una revolucionaria aproximación con enormes perspectivas dentro de la investigación en el ámbito hispánico de las humanidades que no se había planteado hasta hoy como reto.

Precio público del curso

Precio público de matrícula: 240 €

Además de los descuentos establecidos por la UNED, se aplicarán los siguientes descuentos específicos sobre el precio de este título a:
Captura
– Los miembros del Laboratorio de Innovación en Humanidades Digitales de la UNED (30%)

– Los alumnos matriculados en años anteriores en el Experto Profesional en Humanidades Digitales (20%)

– Los miembros de la Asociación de Humanidades Digitales Hispánicas que estén al corriente del pago de la cuota (10%)

AUDIENCIA DEL CURSO

No es necesario cumplir con ningún requisito académico para acceder al curso. Está destinado principalmente a:

– Estudiantes con formación en distintas áreas de Humanidades que deseen adquirir conocimientos tecnológicos para enfrentarse a los nuevos retos que ofrece el análisis digital automatizado del texto, abriendo nuevas perspectivas.

– Investigadores actualmente trabajando en proyectos de diferentes disciplinas humanísticas (filología, arte, historia, filosofía…) que deseen ponerse al día sobre las herramientas y perspectivas tecnológicas existentes con el fin de poder aplicarlas a sus proyectos reales de investigación.

– Profesionales que trabajen en el campo de las humanidades(principalmente GLAM: Galerías, Bibliotecas/Libraries, Archivos y Museos) y que deseen aumentar sus competencias digitales en análisis textual para poder aplicarlas en su propio trabajo.

– Personas pertenecientes a otras disciplinas que estén interesados por conocer las Humanidades Digitales y acercarse a un tipo de trabajo interdisciplinar y muy actual.

En especial, este curso está diseñado para aquellas personas que se dedican a la investigación y el trabajo con textos y quieran ir más allá de las posibilidades que ofrecen los programas del estilo de WordSmith, AntConc y Excel.

El curso está dirigido a cualquier licenciado o graduado de humanidades con unos conocimientos básicos de informática.

METODOLOGÍA

El curso será completamente online. Se trabajará sobre documentos digitalizados y se irá proponiendo realizar diferentes experimentos (minería, análisis de datos textuales, visualizaciones en distintos formatos, extracción de conclusiones, etc).

El objetivo final es sentar las bases para la realización de análisis textuales cuantitativos en áreas de estudio que hasta ahora solo se han preocupado por los métodos cualitativos.

CRITERIOS DE EVALUACIÓN

Al final de cada tema se le propondrá al estudiante que, basándose en lo que se ha expuesto en el tema, realice unas prácticas.

PROGRAMACIÓN
  • TEMAS
  • Introducción a R (instalación y primeros pasos)
  • Calcular la frecuencia de palabras de un texto
  • Análisis de la distribución de tokens en un texto
  • Análisis de correlación
  • Medir la variedad y riqueza léxica de un texto
  • Cálculo de hapax
  • Calidad del texto, variedad de textos y el XML
  • Análisis de grupos (clustering)
  • Clasificación
  • Modelado de temas (topic modelling)
  • PROFESORES
  • Elena González-Blanco García
    Departamento de Literatura Española y Teoría de la Literatura de la UNED
  • Salvador Ros Muñoz
    Departamento de Sistemas de Comunicación y Control, UNED
  • Roberto Hernández Berliches
    Departamento de Sistemas de Comunicación y Control, UNED
  • Antonio Robles Gómez
    Departamento de Sistemas de Comunicación y Control, UNED
  • José Manuel Fradejas
    Colaborador externo
  • Cálculo de hapax
  • Calidad del texto, variedad de textos y el XML
  • Análisis de grupos (clustering)
  • Clasificación
  • Modelado de temas (topic modelling)

DURACIÓN Y DEDICACIÓN

Del lunes 9 de enero del 2017 al miércoles 31 de mayo de 2017.

El curso tendrá un duración equivalente a 6 créditos ETCS. Se iniciará en enero y finalizará en mayo, lo que supone un total de 20 semanas lectivas, con una dedicación media de por parte del estudiante de entre 7 y 8 horas semanales.

MATERIAL DIDÁCTICO PARA EL SEGUIMIENTO DEL CURSO

4.1 Material obligatorio

4.1.1 Material en Plataforma Virtual

El equipo docente colocará en la plataforma virtual materiales elaborados por ellos mismos en formato digital.

4.1.2 Material enviado por el equipo docente (apuntes, pruebas de evaluación, memorias externas, …. )

El equipo docente colocará en la plataforma virtual los enlaces a los materiales correspondientes, digitales y disponibles en abierto

ATENCIÓN AL ESTUDIANTE

Cada profesor indicará en la web su horario y sistema preferente de tutorías.

Para cuestiones relativas al funcionamiento general del curso, pueden dirigirse a:
Elena González-Blanco García

Dpto. de Literatura Española y Teoría de la Literatura, Despacho 722
Facultad de Filología, UNED
Paseo Senda del Rey 7
28040 MADRID
tel. 91 3986873
Horario preferente de tutorías presenciales y de consultas telefónicas: martes 9:30-19:00 y miércoles 9:30-14:00, previa cita por email, a ser posible, a egonzalezblanco@flog.uned.es

CRITERIOS DE EVALUACIÓN Y CALIFICACIÓN

La evaluación se realizará mediante trabajos planteados, tutelados y corregidos por el Equipo Docente, así como mediante cuestionarios a través de la plataforma. Se evaluarán los conocimientos adquiridos en la lectura de los materiales, pero los trabajos tendrán una orientación eminentemente práctica, de aplicación de las herramientas tecnológicas estudiadas a problemas concretos y reales de las distintas áreas de humanidades(edición de textos, digitalización de imágenes, bibliotecas virtuales, etc).

Contáctanos