Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése

Gosztolya Gábor; Vincze Veronika; Grósz Tamás; Tóth László: Egy magyar nyelvű beszédfelismerő rendszer szószintű hibáinak elemzése.

[thumbnail of msznykonf_012_100-110.pdf]

Előnézet

Cikk, tanulmány, mű
msznykonf_012_100-110.pdf
Letöltés (124kB) | Előnézet

Absztrakt (kivonat)

Az automatikus beszédfelismerő rendszerek szószintű hibáját hagyományosan egy illesztési távolságon alapuló metrikával mérjük, amely a szóalakok pontos egyezésének vizsgálatán alapszik. Mint a legtöbb beszédfelismerési technika, ez is jól illeszkedik az angol nyelvre, más (pl. ragozó) nyelvekre azonban ez nem feltétlenül igaz. Ebben a cikkben azt vizsgáljuk, hogy egy hagyományosnak számító beszédfelismerő rendszer (mély neuronhálós akusztikus modell és szó-trigram nyelvi modell) milyen jellegű hibákat vét. Ehhez száz hangfelvétel hibáit gyűjtöttük ki, annotáltuk manuálisan, majd elemeztük. Végkövetkeztetésünk, hogy a szótárban nem szereplő elemek mellett nagy gondot okoz a magyar nyelvben az egybe- és különírások kezelése, melyet a hagyományos pontosságmetrika különösen nagy mértékben büntet.

Mű típusa:	Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe:	Magyar Számítógépes Nyelvészeti Konferencia
Dátum:	2016
Kötet:	12
ISBN:	978-963-306-450-4
Oldalak:	pp. 100-110
Nyelv:	magyar
Konferencia neve:	Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Befoglaló mű URL:	http://acta.bibl.u-szeged.hu/58553/
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Megjegyzések:	Bibliogr.: 110. p. ; összefoglalás magyar nyelven
Feltöltés dátuma:	2019. júl. 01. 09:14
Utolsó módosítás:	2026. feb. 24. 08:10
URI:	http://acta.bibl.u-szeged.hu/id/eprint/58966

Bővebben:

Tétel nézet