Nemeskey Dávid Márk: emLam - a Hungarian Language Modeling baseline.
Előnézet |
Cikk, tanulmány, mű
klskla.pdf Letöltés (453kB) | Előnézet |
Absztrakt (kivonat)
This paper aims to make up for the lack of documented baselines for Hungarian language modeling. Various approaches are evaluated on three publicly available Hungarian corpora. Perplexity values comparable to models of similar-sized English corpora are reported. A new, freely downloadable Hungarian benchmark corpus is introduced.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2017 |
Kötet: | 13 |
ISBN: | 978-963-306-518-1 |
Oldalak: | pp. 91-102 |
Konferencia neve: | Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/58554/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr.: p. 100-102. ; összefoglalás angol nyelven |
Feltöltés dátuma: | 2019. júl. 01. 13:29 |
Utolsó módosítás: | 2022. nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/59000 |
Tétel nézet |