Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal

Tündik, Máté Ákos and Szaszák, György: Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal. Magyar Számítógépes Nyelvészeti Konferencia, (13). pp. 275-286. (2019)

[img] Cikk, tanulmány, mű
msznykonf_015_275-286.pdf

Download (691kB)

Abstract

Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek során a szó- és/vagy akusztikai eseménysorozathoz írásjeleket rendelünk. Ezt a technikát pl. a beszédfelismerő központozatlan kimenetére alkalmazva a szöveg sokkal olvashatóbbá, érthetőbbé válik. Cikkünkben pehelysúlyú kombinált központozási megoldásokat mutatunk be, melyhez karakter- és szószintű beágyazás (embedding) vektorokat, valamint egy 39 dimenziós akusztikai jellemzővektort is felhasználunk. Kísérleteinket két magyar nyelvű, hírműsorokat, illetve felolvasást tartalmazó korpuszon végeztük el. Eredményeinkkel igazoljuk, hogy a kombinált módszerekkel hatékonyabb tud lenni az írásjelek visszaállítása, mintha csak egy-egy szöveges vagy akusztikus komponensre támaszkodnánk.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2019
Volume: 13
Page Range: pp. 275-286
ISBN: 978-963-315-393-2
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 285-286. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 03. 13:36
Last Modified: 2019. Jul. 03. 13:36
URI: http://acta.bibl.u-szeged.hu/id/eprint/59092

Actions (login required)

View Item View Item