title

GAIKA

Clasificador de documentos

El objetivo de la herramienta Gaika es establecer la temática de documentos escritos mediante la categorización de documentos.

Gaika extrae los términos de un texto, y contrasta dichos términos con un diccionario o léxico que tiene definida una clasificación temática. Como resultado, establece que el texto o documento en cuestión pertenece a un tema concreto (Derecho, Biología, etc.).

Este recurso para la clasificación es pieza fundamental en diversos procesos que se realizan mediante PLN: extracción de información (IE, Information Extraction), recuperación de documentos (IR, Information Retrieval), clasificación de documentos (Document classification / categorization), resumen automático de documentos automatikoa (Summarization), etc.