Koloka
Euskaraz eta gaztelaniaz hitz anitzeko unitateak, hau da, kolokazioak automatikoki detektatzen eta erauzten ditu UZEIk sortutako baliabide honek.
Koloka baliabideak metodo linguistikoak erabiltzen ditu (hitz-kategorien hurrenkera edo konbinazio posibleen txantiloiak ditu eratuta, eta eredu edo txantiloi horiek betetzen dituzten konbinazioak hautematen ditu), eta metodo estatistikoekin konbinatuz identifikatzen ditu hitz anitzeko terminoak. Horrela, testu-masa handiak modu eraginkorrean prozesatzen ditu.
Garrantzi handikoa da, bereziki euskararentzat, hitz bat baino gehiagoz osatutako unitateen erauzle automatikoa izatea, esaldiko hitz-ordenaren barnean konbinazio ugari izan baititzake hitz anitzeko unitate batek. Hori dela-eta, terminologian esaterako, terminologoarentzat ez da askotan erraza horrelako termino-hautagai guztiak sistematikoki detektatzea bere lanerako darabilen corpusean.
Koloka erabiltzen du, besteak beste, TermiGai termino-hautagaien erauzle automatikoak.