title

LEX2

Termino-pareen detekzio automatikoa

Hiztegigintza erdiautomatikorako tresna da Lex2 aplikazioa. Corpus paraleloetatik (adibidez, itzulpen-memorietatik) abiatuz, euskara eta gaztelaniazko ordainen termino-pareak automatikoki detektatzen eta erauzten ditu; hots, lexiko elebidunak eratzen ditu.

Emaitza hori lortzeko, metodo linguistiko eta estatistikoez baliatzen da: hizkuntza bakoitzeko testuan termino-hautagaiak identifikatzen ditu, eta, maiztasunaren eta bestelako informazio estatistikoan oinarrituta, hizkuntza bakoitzeko termino-hautagaien arteko lotura posibleak bilatzen ditu. Lotura horiek sendoak izateko probabilitatea handia denean, termino-hautagaiak lerrokatzen ditu, eta lexiko elebiduna osatzen du Lex2k.

Beraz, bilaketa-prozesua ez da iTXEK egiaztatzaileak erabiltzen duena bezalakoa, Lex2k ez dituenez bilatzen sorburu-hizkuntzako terminoak xede-hizkuntzan izan ditzakeen ordainak. Izan ere, Lex2ren helburu behinena ez baita terminologiaren erabilera zuzena edo okerra egiaztatzea.

Aitzitik, Lex2k termino-hautagaiak era independentean bilatzen eta erauzten ditu hizkuntza bakoitzean, eta urrats bat gehiago eginez, paralelotasun estatistikoak bilatzen ditu hautagaien arteko erlazioa detektatzeko. Horrela, testu-bilduma handietan erabiltzen diren terminoekin lexiko elebidunak automatikoki erauzten ditu.

LEX2