Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása

Tarján Balázs; Varga Ádám; Tobler Zoltán; Szaszák György; Fegyó Tibor; Bordás Csaba; Mihajlik Péter: Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása.

[thumbnail of msznykonf_012_089-099.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_012_089-099.pdf

Letöltés (144kB) | Előnézet

Absztrakt (kivonat)

Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi dekóderével is. Ezen felül különböző adatbázis-méretek mellett és újrabeszélés alkalmazásával is végzünk felismerési kísérleteket. Kísérleti rendszerünkkel, mely egy több mint 70 millió szót tartalmazó szövegkorpuszon és egy közel 500 órás beszédadatbázison lett tanítva sikerült az eddig publikált legalacsonyabb szóhibaarányt elérnünk magyar nyelvű, televíziós híradók és közéleti társalgási beszéd témakörén.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2016
Kötet: 12
ISBN: 978-963-306-450-4
Oldalak: pp. 89-99
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58553/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 98-99. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. júl. 01. 09:12
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/58965
Bővebben:
Tétel nézet Tétel nézet