Tóth László; Tarján Balázs; Sárosi Gellért; Mihajlik Péter: Speech recognition experiments with audiobooks. In: Acta cybernetica, (19) 4. pp. 695-713. (2010)
Előnézet |
Cikk, tanulmány, mű
TothL_2010_ActaCybernetica.pdf Letöltés (216kB) | Előnézet |
Absztrakt (kivonat)
Under real-life conditions several factors may be present that make the automatic recognition of speech difficult. The most obvious examples are background noise, peculiarities of the speaker's voice, sloppy articulation and strong emotional load. These all pose difficult problems for robust speech recognition, but it is not exactly clear how much each contributes to the difficulty of the task. In this paper we examine the abilities of our best recognition technologies under near-ideal conditions. The optimal conditions will be simulated by working with the sound material of an audiobook, in which most of the disturbing factors mentioned above are absent. Firstly pure phone recognition experiments will be performed, where neural net-based technologies will also be tried as well as the conventional Hidden Markov Models. Then we move on to large vocabulary recognition, where morphbased language models are applied to improve the performance of the standard word-based technology. The tests clearly justify our assertion that audiobooks pose a much easier recognition task than real-life databases. In both types of tasks we report the lowest error rates we have achieved so far in Hungarian continuous speech recognition.
Mű típusa: | Cikk, tanulmány, mű |
---|---|
Befoglaló folyóirat/kiadvány címe: | Acta cybernetica |
Dátum: | 2010 |
Kötet: | 19 |
Szám: | 4 |
ISSN: | 0324-721X |
Oldalak: | pp. 695-713 |
Nyelv: | angol |
Kiadás helye: | Szeged |
Konferencia neve: | Conference on Hungarian Computational Linguistics (7.) (2010) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/38530/ |
Kulcsszavak: | Számítástechnika, Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr.: p. 711-713. ; összefoglalás angol nyelven |
Szakterület: | 01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány 06. Bölcsészettudományok 06. Bölcsészettudományok > 06.02. Nyelvek és irodalom |
Feltöltés dátuma: | 2016. okt. 15. 12:24 |
Utolsó módosítás: | 2022. jún. 17. 11:19 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/12889 |
Tétel nézet |