Koloka

Euskaraz eta gaztelaniaz hitz anitzeko unitateak, hau da, kolokazioak automatikoki detektatzen eta erauzten ditu UZEIk sortutako baliabide honek.

Koloka baliabideak metodo linguistikoak erabiltzen ditu (hitz-kategorien hurrenkera edo konbinazio posibleen txantiloiak ditu eratuta, eta eredu edo txantiloi horiek betetzen dituzten konbinazioak hautematen ditu), eta metodo estatistikoekin konbinatuz identifikatzen ditu hitz anitzeko terminoak. Horrela, testu-masa handiak modu eraginkorrean prozesatzen ditu.

Garrantzi handikoa da, bereziki euskararentzat, hitz bat baino gehiagoz osatutako unitateen erauzle automatikoa izatea, esaldiko hitz-ordenaren barnean konbinazio ugari izan baititzake hitz anitzeko unitate batek. Hori dela-eta, terminologian esaterako, terminologoarentzat ez da askotan erraza horrelako termino-hautagai guztiak sistematikoki detektatzea bere lanerako darabilen corpusean.

Koloka erabiltzen du, besteak beste, TermiGai termino-hautagaien erauzle automatikoak.

Gipuzkoako foru alduandia
LankidetzaErakundea

EQUALITY

UZEI HAS BEEN DESIGNATED BY THE BASQUE INSTITUTE FOR WOMEN EMAKUNDE AS A COLLABORATING ORGANISATION FOR THE EQUALITY OF WOMEN AND MEN, IN RECOGNITION OF OUR LONG-STANDING COMMITMENT TO EQUALITY.

more information