Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása

Tarján, Balázs and Varga, Ádám and Tobler, Zoltán and Szaszák, György and Fegyó, Tibor and Bordás, Csaba and Mihajlik, Péter: Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása. Magyar Számítógépes Nyelvészeti Konferencia, (10). pp. 89-99. (2016)

[img] Cikk, tanulmány, mű
msznykonf_012_089-099.pdf

Download (144kB)

Abstract

Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi dekóderével is. Ezen felül különböző adatbázis-méretek mellett és újrabeszélés alkalmazásával is végzünk felismerési kísérleteket. Kísérleti rendszerünkkel, mely egy több mint 70 millió szót tartalmazó szövegkorpuszon és egy közel 500 órás beszédadatbázison lett tanítva sikerült az eddig publikált legalacsonyabb szóhibaarányt elérnünk magyar nyelvű, televíziós híradók és közéleti társalgási beszéd témakörén.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2016
Volume: 10
Page Range: pp. 89-99
ISBN: 978-963-306-450-4
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 98-99. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 01. 09:12
Last Modified: 2019. Jul. 01. 09:12
URI: http://acta.bibl.u-szeged.hu/id/eprint/58965

Actions (login required)

View Item View Item