emLam - a Hungarian Language Modeling baseline

Nemeskey Dávid Márk: emLam - a Hungarian Language Modeling baseline.

[thumbnail of klskla.pdf]
Előnézet
Cikk, tanulmány, mű
klskla.pdf

Letöltés (453kB) | Előnézet

Absztrakt (kivonat)

This paper aims to make up for the lack of documented baselines for Hungarian language modeling. Various approaches are evaluated on three publicly available Hungarian corpora. Perplexity values comparable to models of similar-sized English corpora are reported. A new, freely downloadable Hungarian benchmark corpus is introduced.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2017
Kötet: 13
ISBN: 978-963-306-518-1
Oldalak: pp. 91-102
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58554/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 100-102. ; összefoglalás angol nyelven
Feltöltés dátuma: 2019. júl. 01. 13:29
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/59000
Bővebben:
Tétel nézet Tétel nézet