Sárosi Gellért; Tobler Zoltán; Mihajlik Péter; Fegyó Tibor: Lényegkiemelő módszerek összehasonlítása közlekedési zajban történő beszédfelismerés céljából.
Előnézet |
Cikk, tanulmány, mű
msznykonf_007_384-388.pdf Letöltés (81kB) | Előnézet |
Absztrakt (kivonat)
A gépi beszédfelismerés egyik dönt fontosságú eleme a beszéd akusztikai lényegének kiemelése, különösen a zajos környezetben történ alkalmazásoknál, amely jelen esetben közlekedési zajjal terhelt akusztikai környezetet jelentett. Emiatt helyeztük vizsgálatunk középpontjába a zajtr és hagyományos beszédfelismerési lényegkiemelési eljárásokat. A tanítást és tesztelést hat nyelven végeztük el: angol, francia, magyar, német, olasz, spanyol. Teszteléshez a telefonos hálózaton keresztül az utcáról vagy jármbl rögzített adatbázist használtunk. Alaprendszerként teszteltük a HTK és a SPHINX eszközkészletben, vagy általunk is implementált Mel Frequency Cepstral Coefficients (MFCC) és Perceptual Linear Prediction (PLP) módszereket. Az újabb módszerek között a Power-Normalized Cepstral Coefficients (PNCC) és a Perceptual Minimum Variance Distortionless Response (PMVDR) szerepel.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2010 |
Kötet: | 7 |
ISBN: | 978-963-306-075-9 |
Oldalak: | pp. 384-388 |
Konferencia neve: | Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/58548/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr.: p. 387-388. ; összefoglalás magyar nyelven |
Feltöltés dátuma: | 2019. jún. 24. 09:08 |
Utolsó módosítás: | 2022. nov. 08. 11:50 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58781 |
![]() |
Tétel nézet |