Online kontsulta
esLEMA
El lematizador para español
Aunque existen lematizadores de código abierto para español disponibles gratuitamente, UZEI ha optado por desarrollar su propio lematizador para garantizar la calidad y precisión en el resultado de lematización.
Ello aporta un valor añadido a las herramientas de PLN desarrolladas por UZEI, que se basan en sus lematizadores propios, euLEMA y esLEMA.
En efecto, el hecho de que estos dos lematizadores estén basados en reglas y métodos equivalentes garantiza que la calidad del procesamiento de los corpus es homologable tanto en euskera como en castellano.
La base de datos léxica del español esLEX se basa, entre otros, en el lematizador esLEMA. Al igual que el lematizador para el euskera, está basado en una morfología de dos niveles y autómatas de estados finitos.