Mitigating the knowledge acquisition bottleneck for Hungarian word sense disambiguation using multilingual transformers

Berend Gábor: Mitigating the knowledge acquisition bottleneck for Hungarian word sense disambiguation using multilingual transformers.

[thumbnail of msznykonf_017_077-089.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_017_077-089.pdf

Letöltés (308kB) | Előnézet

Absztrakt (kivonat)

A major hurdle in training all-words word sense disambiguation (WSD) systems for new domains and/or languages is the limited availability of sense annotated training corpora and that their construction is an extremely costly and labor-intensive process. In this paper, we investigate the utilization of multilingual transformer-based language models for performing cross-lingual WSD in the zero-shot setting. Our empirical results suggest that by relying on the intriguing multilingual abilities of pre-trained language models, we can infer reliable sense labels to Hungarian textual utterances in the all-word WSD setting by purely relying on sense-annotated training data in English.

Mű típusa: Konferencia vagy workshop anyag
Rovatcím: Szemantika
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2021
Kötet: 17
ISBN: 978-963-306-781-9
Oldalak: pp. 77-89
Nyelv: angol
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (17.) (2021) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/73340/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 86-89. és a lábjegyzetekben ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06. Bölcsészettudományok > 06.02. Nyelvek és irodalom
Feltöltés dátuma: 2021. szep. 28. 10:55
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/73359
Bővebben:
Tétel nézet Tétel nézet