title

GAIKA

Dokumentu-sailkatzailea

Dokumentu-kategorizazioaren bidez dokumentu idatzien gaia zehaztea da Gaika tresnaren xedea.

Testu bateko terminoak erauzten ditu Gaikak, eta sailkapenak zehaztuta dituen hiztegi edo lexiko baten informazioarekin kontrastatzen ditu termino horiek. Horren bitartez, testu edo dokumentu hori gai jakin bati buruzkoa dela ebazten du (Zuzenbidea, Biologia, eta abar).

Dokumentuen gaia zehazteko baliabide hau pieza funtsezkoa da hizkuntza naturalaren prozesamendu bidez egiten diren hainbat jardueratan: informazio-erauzketa (IE, Information Extraction), dokumentuen berreskuratzea (IR, Information Retrieval), dokumentu-sailkatzea (Document classification / categorization), dokumentu-laburpen automatikoa (Summarization), eta abar.