%0 Conference Paper
%A  Tündik Máté Ákos
%A  Szaszák György
%B Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)
%D 2020
%F acta:67666
%K Nyelvészet - számítógép alkalmazása
%P 245-257
%T ASR-hibaterjedés vizsgálata a gépi beszédértés szemszögéből
%U http://acta.bibl.u-szeged.hu/67666/
%V 16
%X Napjainkban a mesterséges intelligencia alapú megoldások egyre inkább a beszélt nyelv gépi megértésére törekednek. Ennek preferált megközelítése az, amikor automatikus beszédfelismerő (ASR) rendszerek használatával átiratokat hozunk létre, amelyek további, szövegalapú elemzésen mennek keresztül. A gépi átiratok szóhibákat is tartalmazhatnak; ezen hibák továbbterjednek a szöveges feldolgozási folyamatba, így a gépi központozásba, kivonatolásba is. Ugyanakkor szubjektív tesztjeink azt igazolták, hogy az emberek a gépi átiratokat a szóhibák és a központozási hibák ellenére is jól tudják értelmezni. Célunk az, hogy bemutassuk az ASR-hibaterjedésből adódó, szemantikai térben bekövetkező információveszteségeket, valamint az ASR-hibaterjedés automatikus összefoglalásra gyakorolt hatását is elemezzük. Bemutatjuk, hogy az egyes mondatreprezentációk a szóhibák hatására enyhén eltolódnak a szemantikai térben, de ez jócskán elmarad a dokumentum mondatainak átlagos szemantikai távolságától. Megmutatjuk azt is, hogy a központozás hibáinak nagyobb hatása van az összefoglalók kiértékelésére, mint a szóhibáknak, ami arra enged következtetni, hogy a feladathoz elengedhetetlen a megfelelő mondatszintű tokenizálás.
%Z Bibliogr.: p. 255-257. ; ill. ; összefoglalás magyar nyelven