Hybrid lemmatization in HuSpaCy

Berkecz Péter; Orosz György; Szántó Zsolt; Szabó Gergő; Farkas Richárd: Hybrid lemmatization in HuSpaCy.

[thumbnail of msznykonf_019_319-330..pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_019_319-330..pdf

Letöltés (533kB) | Előnézet

Absztrakt (kivonat)

Lemmatization is still not a trivial task for morphologically rich languages. Previous studies showed that hybrid architectures usually work better for these languages and can yield great results. This paper presents a hybrid lemmatizer utilizing both a neural model, dictionaries and hand-crafted rules. We introduce a hybrid architecture along with empirical results on a widely used Hungarian dataset. The presented methods are published as three HuSpaCy models.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2023
Kötet: 19
ISBN: 978-963-306-912-7
Oldalak: pp. 319-330
Nyelv: angol
Kiadás helye: Szeged
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (19.)
Konferencia típusa: Konferencia
Helyszin: Szeged
Dátum: 2023. január 26-27.
Befoglaló mű URL: https://acta.bibl.u-szeged.hu/78307/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 328-330. ; ill. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma: 2023. már. 16. 09:50
Utolsó módosítás: 2023. már. 16. 09:50
URI: http://acta.bibl.u-szeged.hu/id/eprint/78422
Bővebben:
Tétel nézet Tétel nézet