CLARIN CENTRO -K-Español

CLARIN Centro-K-Español forma parte de la infraestructura europea CLARIN y tiene como objetivo ofrecer los conocimientos y la experiencia de los tres grupos que inicialmente lo componen en la utilización de tecnología para la investigación en humanidades y ciencias sociales.

ALGUNAS HERRAMIENTAS

QUIENES SOMOS

Somos el primer Centro Clarin Knowledge y la representación
de la infraestructura CLARIN en España.

CC-CLARIN IULA-UPF(Barcelona)

El Centro de Competencias CLARIN IULA-UPF (CC-CLARIN IULA-UPFestá especializado en Análisis y Minería de Textos y en Tecnologías y Recursos del Lenguaje. El Centro ofrece servicios a los investigadores que trabajan con datos textuales, especialmente en castellano y catalán. El centro también cuenta con la experiencia de HDLab@UPF, un nuevo entorno de investigación y aprendizaje desarrollado por el Departamento de Humanidades de la UPF. El HDLab@UPF está especializado en métodos digitales para la mejora de la investigación en Humanidades, así como en nuevos enfoques sobre los objetos digitales y su difusión (interactividad, multimedia, visualización de datos, reutilización de contenidos digitales, etc.).

LINDH-UNED (Madrid)

El Laboratorio de Innovación en Humanidades Digitales (LINDH) es un centro de investigación en Humanidades Digitales de la UNED dedicado a la innovación, investigación, consultoría y aprendizaje para los investigadores y proyectos en español. LINDH está especializado en los beneficios del enriquecimiento de textos, la web semántica, las bases de datos y la edición digital. Se ocupa de velar por los estándares propios de las humanidades digitales, como el TEI-XML para el marcado de textos, además de ofrecer un acercamiento al mundo hispanohablante de los proyectos, recursos y actividades de otros países,principalmente anglófonos.

IXA (UPV/EHU) (Donostia-San Sebastián)

El Grupo IXA (UPV/EHU) es un grupo multidisciplinar que incluye miembros de cuatro departamentos de la Universidad del País Vasco (UPV/EHU). Está especializado en el Análisis y Minería de Textos y en las Tecnologías y Recursos del Lenguaje. El grupo ofrece servicios a los investigadores que trabajan con textos sobre todo en euskera, pero también en castellano e inglés y está especializado en el procesamiento del euskera.

Grupo TALG

El grupo de investigación en Tecnologías y Aplicaciones de la Lengua Gallega (Grupo TALG) de la Universidad de Vigo está especializado en el desarrollo de recursos lingüísticos digitales para facilitar el uso del gallego, su traducción, su estudio y su aprendizaje en el entorno tecnológico de la sociedad de la información.
QUÉ HACEMOS

SERVICIOS

El CLARIN Centro-K-Español consta de los servicios que aportan sus grupos participantes y que en el Centro-K se asocian para constituirse en un punto de acceso único y actuar así de agente de distribución de solicitudes de servicios. Como Centro-K, suman las fortalezas de los tres centros participantes con el fin de ofrecer servicios a la comunidad de forma unificada y organizada.
Los servicios que  el CLARIN Centro-K-español ofrece son:
– Consultoría virtual para asesorar y responder dudas sobre cuestiones prácticas relacionadas con estándares, uso de herramientas de procesamiento y acceso a recursos lingüísticos. El centro ofrece contacto por correo electrónico con garantía de respuesta en 24 horas. Se trata de un servicio de orientación personalizada y que también pone al servicio de los investigadores documentación y casos de uso conocidos en los que encontrar buenas prácticas.
– Soporte para auto-aprendizaje con recursos especializados: catálogos especializados donde encontrar información sobre prácticas actuales y acceso directo a herramientas, en aplicaciones web, que facilitan el uso de las tecnologías existentes, videotutoriales, MOOCs, etc.
– Organización de programas de enseñanza y formación para investigadores, estudiantes, proyectos o grupos de interés.
– Servicios tecnológicos y de gestión y planificación de proyectos personalizados en función de las necesidades de los solicitantes.

HERRAMIENTAS

CLARIN Centro-K-español ofrece la posibilidad de explorar la utilización de herramientas que han sido desarrolladas para que la investigación en humanidades y ciencias sociales pueda tener una base lingüística fiable y de fácil uso.

 

IXA-UPV ha desarrollado más de 20 herramientas, algunas de las cuales han sido reutilizadas y rediseñadas para el Centro-K. Estas nuevas herramientas son útiles para un uso masivo e intuitivo, como por ejemplo, el programa ANALITZAK basado en los IXA-PIPES, con el que se obtienen frecuencias de morfemas, palabras por categorías o entidades de textos y webs tanto en euskera, como en inglés y en castellano. Para la consulta de información lingüística de diferentes niveles se ofrece, además, acceso web a bases de datos y herramientas de uso sencillo.

CC-CLARIN IULA-UPF ha desarrollado aplicaciones web como ContaWords  con la que el usuario puede obtener información cuantitativa de textos -aportados por el usuario o de la web- en un formato fácilmente manipulable por el usuario. También ofrece acceso web a analizadores de dependencias sintácticas para el español  y a otras herramientas básicas de análisis populares como el analizador morfosintáctico de FreeLing  y el reconocedor y clasificador de entidades nombradas, también de FreeLing.

PUBLICACIONES

  • Bel, Núria; Elena Gonzalez-Blanco, Mikel Iruskieta. 2016. CLARIN Centro-K-español. Procesamiento del Lenguaje Natural 57: 151-154. ISSN: 1135-5948
Share This