Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése

Gosztolya, Gábor and Vincze, Veronika and Grósz, Tamás and Tóth, László: Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése. Magyar Számítógépes Nyelvészeti Konferencia, (10). pp. 100-110. (2016)

[img] Cikk, tanulmány, mű
msznykonf_012_100-110.pdf

Download (124kB)

Abstract

Az automatikus beszédfelismerő rendszerek szószintű hibáját hagyományosan egy illesztési távolságon alapuló metrikával mérjük, amely a szóalakok pontos egyezésének vizsgálatán alapszik. Mint a legtöbb beszédfelismerési technika, ez is jól illeszkedik az angol nyelvre, más (pl. ragozó) nyelvekre azonban ez nem feltétlenül igaz. Ebben a cikkben azt vizsgáljuk, hogy egy hagyományosnak számító beszédfelismerő rendszer (mély neuronhálós akusztikus modell és szó-trigram nyelvi modell) milyen jellegű hibákat vét. Ehhez száz hangfelvétel hibáit gyűjtöttük ki, annotáltuk manuálisan, majd elemeztük. Végkövetkeztetésünk, hogy a szótárban nem szereplő elemek mellett nagy gondot okoz a magyar nyelvben az egybe- és különírások kezelése, melyet a hagyományos pontosságmetrika különösen nagy mértékben büntet.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2016
Volume: 10
Page Range: pp. 100-110
ISBN: 978-963-306-450-4
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: 110. p. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 01. 09:14
Last Modified: 2019. Jul. 01. 09:14
URI: http://acta.bibl.u-szeged.hu/id/eprint/58966

Actions (login required)

View Item View Item