euLEX
Base de datos léxica del euskera
euLEX es la base de datos léxica del euskera, un recurso lingüístico básico creado por UZEI para el tratamiento automático del euskera. Sin duda, euLEX es el léxico más completo y actualizado en euskera, lo que lo convierte en un pilar esencial para garantizar la utilidad del resto de herramientas lingüísticas que UZEI ha desarrollado a partir de esta base de datos.
euLEX es el lexicón etiquetado esencial para el funcionamiento de todas las herramientas y productos PLN (analizadores, lematizadores, correctores, buscadores, extractores de términos, clasificadores de temas…) desarrollados por UZEI para el euskera.

Cuenta con cerca de 160.000 entradas de información léxica, morfosintáctica e información semántica básica. Se actualiza de forma constante siguiendo las normas y criterios publicados por Euskaltzaindia y la Comisión de Terminología.
Además, incorpora las formas de uso preferente o recomendadas por esas autoridades lingüísticas, no solo registrando las formas aceptadas, sino también aquellas que son menos adecuadas o cuyo uso está desaconsejado, remitiendo, en esos casos, a la formas recomendadas.