Telephone speech recognition via the combination of knowledge sources in a segmental speech model

Tóth László; Kocsor András; Gosztolya Gábor: Telephone speech recognition via the combination of knowledge sources in a segmental speech model. In: Acta cybernetica, (16) 4. pp. 643-657. (2004)

[thumbnail of Toth_2004_ActaCybernetica.pdf]
Előnézet
Cikk, tanulmány, mű
Toth_2004_ActaCybernetica.pdf

Letöltés (166kB) | Előnézet

Absztrakt (kivonat)

The currently dominant speech recognition methodology, Hidden Markov Modeling, treats speech as a stochastic random process with very simple mathematical properties. The simplistic assumptions of the model, and especially that of the independence of the observation vectors have been criticized by many in the literature, and alternative solutions have been proposed. One such alternative is segmental modeling, and the OASIS recognizer we have been working on in the recent years belongs to this category. In this paper we go one step further and suggest that we should consider speech recognition as a knowledge source combination problem. We offer a generalized algorithmic framework for this approach and show that both hidden Markov and segmental modeling are a special case of this decoding scheme. In the second part of the paper we describe the current components of the OASIS system and evaluate its performance on a very difficult recognition task, the phonetically balanced sentences of the MTBA Hungarian Telephone Speech Database. Our results show that OASIS outperforms a traditional HMM system in phoneme classification and achieves practically the same recognition scores at the sentence level.

Mű típusa: Cikk, tanulmány, mű
Befoglaló folyóirat/kiadvány címe: Acta cybernetica
Dátum: 2004
Kötet: 16
Szám: 4
ISSN: 0324-721X
Oldalak: pp. 643-657
Nyelv: angol
Kiadás helye: Szeged
Konferencia neve: Conference on Hungarian Computational Linguistics (1.) (2003) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/38518/
Kulcsszavak: Számítástechnika, Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 655-657. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06. Bölcsészettudományok > 06.02. Nyelvek és irodalom
Feltöltés dátuma: 2016. okt. 15. 12:25
Utolsó módosítás: 2022. jún. 15. 11:09
URI: http://acta.bibl.u-szeged.hu/id/eprint/12747
Bővebben:
Tétel nézet Tétel nézet