Lightweight diacritics restoration for V4 languages

Csanády Bálint; Lukács András: Lightweight diacritics restoration for V4 languages.

[thumbnail of msznykonf_018_549-559.pdf] Cikk, tanulmány, mű
msznykonf_018_549-559.pdf

Letöltés (527kB)

Absztrakt (kivonat)

Diacritics restoration became a ubiquitous task in the Latinalphabet-based English-dominated Internet language environment. In this article, we describe a small footprint 1D convolution-based approach, which works on character-level. The model even runs locally in a web browser, and surpasses the performance of similarly sized models. We evaluate our model on the languages of the Visegrád Group, with emphasis on Hungarian.

Mű típusa: Konferencia vagy workshop anyag
Rovatcím: Poszter, laptopos bemutató
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2022
Kötet: 18
ISBN: 978-963-306-848-9
Oldalak: pp. 549-559
Nyelv: angol
Kiadás helye: Szeged
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/75797/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 558-559. és a lábjegyzetekben ; ill. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06. Bölcsészettudományok > 06.02. Nyelvek és irodalom
Feltöltés dátuma: 2022. máj. 25. 13:59
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/75899
Bővebben:
Tétel nézet Tétel nézet