Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása

Tarján Balázs and Varga Ádám and Tobler Zoltán and Szaszák György and Fegyó Tibor and Bordás Csaba and Mihajlik Péter: Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása.

[thumbnail of msznykonf_012_089-099.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_012_089-099.pdf

Download (144kB) | Preview

Abstract

Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi dekóderével is. Ezen felül különböző adatbázis-méretek mellett és újrabeszélés alkalmazásával is végzünk felismerési kísérleteket. Kísérleti rendszerünkkel, mely egy több mint 70 millió szót tartalmazó szövegkorpuszon és egy közel 500 órás beszédadatbázison lett tanítva sikerült az eddig publikált legalacsonyabb szóhibaarányt elérnünk magyar nyelvű, televíziós híradók és közéleti társalgási beszéd témakörén.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2016
Volume: 12
ISBN: 978-963-306-450-4
Page Range: pp. 89-99
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/58553/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 98-99. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 01. 09:12
Last Modified: 2022. Nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/58965

Actions (login required)

View Item View Item