Comparison of distributed language models on medium-resourced languages

Makrai Márton: Comparison of distributed language models on medium-resourced languages.

[thumbnail of msznykonf_011_022-033.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_011_022-033.pdf

Letöltés (191kB) | Előnézet

Absztrakt (kivonat)

word2vec and GloVe are the two most successful open-source tools that compute distributed language models from gigaword corpora. word2vec implements the neural network style architectures skip-gram and cbow, learning parameters using each word as a training sample, while GloVe factorizes the cooccurrence-matrix (or more precisely a matrix of conditional probabilities) as a whole. In the present work, we compare the two systems on two tasks: a Hungarian equivalent of a popular word analogy task and word translation between European languages including medium-resourced ones e.g. Hungarian, Lithuanian and Slovenian.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2015
Kötet: 11
ISBN: 978-963-306-359-0
Oldalak: pp. 22-33
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58552/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: 33. p. ; összefoglalás angol nyelven
Feltöltés dátuma: 2019. jún. 28. 08:09
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/58918
Bővebben:
Tétel nézet Tétel nézet