title

TermiGai

Basándose en corpus de textos del euskera y del español, esta herramienta ha sido desarrollada por UZEI para identificar y analizar automáticamente los candidatos a término de dichas masas de texto.

Bases del análisis

TermiGai identifica los candidatos a término de una muestra de texto combinando métodos lingüísticos y estadísticos. Utiliza para su análisis los lematizadores automáticos euLEMA y esLEMA y el extractor de unidades léxicas multipalabra  Koloka.

Funcionalidades

Esta herramienta se puede utilizar de diversas maneras, según las características de cada texto o los resultados que se desean obtener. Estas son las funcionalidades principales de TermiGai:

  • TermiGai puede realizar su análisis mediante el uso únicamente de léxico general o de la suma de léxico general y especializado.
  • En el caso de las unidades léxicas multipalabra, se puede elegir el nivel de confianza. Cuanto mayor sea el nivel seleccionado, mayor fiabilidad tendrán los candidatos propuestos por la TermiGai, aunque proponga un menor número de ellos.

TermiGai constituye una gran ayuda para la elaboración de nuevos diccionarios terminológicos o para la actualización de la terminología de un ámbito concreto, ya que proporciona candidatos de términos en euskera y en español procesando automáticamente grandes masas de texto. El resultado del análisis ayuda al terminólogo en el estudio de amplios corpus de texto.

TermiGai