Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése

Gosztolya Gábor and Vincze Veronika and Grósz Tamás and Tóth László: Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése.

[thumbnail of msznykonf_012_100-110.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_012_100-110.pdf

Download (124kB) | Preview

Abstract

Az automatikus beszédfelismerő rendszerek szószintű hibáját hagyományosan egy illesztési távolságon alapuló metrikával mérjük, amely a szóalakok pontos egyezésének vizsgálatán alapszik. Mint a legtöbb beszédfelismerési technika, ez is jól illeszkedik az angol nyelvre, más (pl. ragozó) nyelvekre azonban ez nem feltétlenül igaz. Ebben a cikkben azt vizsgáljuk, hogy egy hagyományosnak számító beszédfelismerő rendszer (mély neuronhálós akusztikus modell és szó-trigram nyelvi modell) milyen jellegű hibákat vét. Ehhez száz hangfelvétel hibáit gyűjtöttük ki, annotáltuk manuálisan, majd elemeztük. Végkövetkeztetésünk, hogy a szótárban nem szereplő elemek mellett nagy gondot okoz a magyar nyelvben az egybe- és különírások kezelése, melyet a hagyományos pontosságmetrika különösen nagy mértékben büntet.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2016
Volume: 12
ISBN: 978-963-306-450-4
Page Range: pp. 100-110
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/58553/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: 110. p. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 01. 09:14
Last Modified: 2022. Nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/58966

Actions (login required)

View Item View Item