Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése

Gosztolya Gábor; Vincze Veronika; Grósz Tamás; Tóth László: Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése.

[thumbnail of msznykonf_012_100-110.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_012_100-110.pdf

Letöltés (124kB) | Előnézet

Absztrakt (kivonat)

Az automatikus beszédfelismerő rendszerek szószintű hibáját hagyományosan egy illesztési távolságon alapuló metrikával mérjük, amely a szóalakok pontos egyezésének vizsgálatán alapszik. Mint a legtöbb beszédfelismerési technika, ez is jól illeszkedik az angol nyelvre, más (pl. ragozó) nyelvekre azonban ez nem feltétlenül igaz. Ebben a cikkben azt vizsgáljuk, hogy egy hagyományosnak számító beszédfelismerő rendszer (mély neuronhálós akusztikus modell és szó-trigram nyelvi modell) milyen jellegű hibákat vét. Ehhez száz hangfelvétel hibáit gyűjtöttük ki, annotáltuk manuálisan, majd elemeztük. Végkövetkeztetésünk, hogy a szótárban nem szereplő elemek mellett nagy gondot okoz a magyar nyelvben az egybe- és különírások kezelése, melyet a hagyományos pontosságmetrika különösen nagy mértékben büntet.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2016
Kötet: 12
ISBN: 978-963-306-450-4
Oldalak: pp. 100-110
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58553/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: 110. p. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. júl. 01. 09:14
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/58966
Bővebben:
Tétel nézet Tétel nézet