Utilizing word embeddings for part-of-speech tagging

Berend Gábor: Utilizing word embeddings for part-of-speech tagging.

[thumbnail of msznykonf_012_059-067.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_012_059-067.pdf

Letöltés (122kB) | Előnézet

Absztrakt (kivonat)

In this paper, we illustrate the power of distributed word representations for the part-of-speech tagging of Hungarian texts. We trained CRF models for POS-tagging that made use of features derived from the sparse coding of the word embeddings of Hungarian words as signals. We show that relying on such a representation, it is possible to avoid the creation of language specific features for achieving reliable performance. We evaluated our models on all the subsections of the Szeged Treebank both using MSD and universal morphology tag sets. Furthermore, we also report results for inter-subcorpora experiments.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2016
Kötet: 12
ISBN: 978-963-306-450-4
Oldalak: pp. 59-67
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58553/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 66-67. ; összefoglalás angol nyelven
Feltöltés dátuma: 2019. júl. 01. 08:51
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/58962
Bővebben:
Tétel nézet Tétel nézet