title

esLEMA

Lematizador del español

Aunque en el mercado hay disponibles lematizadores del español de código abierto, UZEI ha optado por desarrollar un lematizador propio, a fin de asegurar una mayor calidad y exactitud en el resultado de su lematizador.

Esto confiere un valor añadido a las herramientas de PLN de UZEI, que están basadas en los lematizadores euLEMA y esLEMA.

Al estar los dos lematizadores basados en reglas y métodos parejos, se asegura una calidad homologable en el procesamiento de los corpus tanto en euskera como en español.

El lematizador esLEMA se basa, en primer lugar, en la base de datos léxica esLEX. Y, al igual que el lematizador del euskera, utiliza morfología de dos niveles y autómatas de estados finitos.

demoa