Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal

Tündik Máté Ákos; Szaszák György: Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal.

[thumbnail of msznykonf_015_275-286.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_015_275-286.pdf

Letöltés (691kB) | Előnézet

Absztrakt (kivonat)

Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek során a szó- és/vagy akusztikai eseménysorozathoz írásjeleket rendelünk. Ezt a technikát pl. a beszédfelismerő központozatlan kimenetére alkalmazva a szöveg sokkal olvashatóbbá, érthetőbbé válik. Cikkünkben pehelysúlyú kombinált központozási megoldásokat mutatunk be, melyhez karakter- és szószintű beágyazás (embedding) vektorokat, valamint egy 39 dimenziós akusztikai jellemzővektort is felhasználunk. Kísérleteinket két magyar nyelvű, hírműsorokat, illetve felolvasást tartalmazó korpuszon végeztük el. Eredményeinkkel igazoljuk, hogy a kombinált módszerekkel hatékonyabb tud lenni az írásjelek visszaállítása, mintha csak egy-egy szöveges vagy akusztikus komponensre támaszkodnánk.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2019
Kötet: 15
ISBN: 978-963-315-393-2
Oldalak: pp. 275-286
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58556/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 285-286. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. júl. 03. 13:36
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/59092
Bővebben:
Tétel nézet Tétel nézet