Tarján Balázs and Varga Ádám and Tobler Zoltán and Szaszák György and Fegyó Tibor and Bordás Csaba and Mihajlik Péter: Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása.
Preview |
Cikk, tanulmány, mű
msznykonf_012_089-099.pdf Download (144kB) | Preview |
Abstract
Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi dekóderével is. Ezen felül különböző adatbázis-méretek mellett és újrabeszélés alkalmazásával is végzünk felismerési kísérleteket. Kísérleti rendszerünkkel, mely egy több mint 70 millió szót tartalmazó szövegkorpuszon és egy közel 500 órás beszédadatbázison lett tanítva sikerült az eddig publikált legalacsonyabb szóhibaarányt elérnünk magyar nyelvű, televíziós híradók és közéleti társalgási beszéd témakörén.
Item Type: | Conference or Workshop Item |
---|---|
Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
Date: | 2016 |
Volume: | 12 |
ISBN: | 978-963-306-450-4 |
Page Range: | pp. 89-99 |
Event Title: | Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged) |
Related URLs: | http://acta.bibl.u-szeged.hu/58553/ |
Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása |
Additional Information: | Bibliogr.: p. 98-99. ; összefoglalás magyar nyelven |
Date Deposited: | 2019. Jul. 01. 09:12 |
Last Modified: | 2022. Nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58965 |
Actions (login required)
![]() |
View Item |