Lényegkiemelő módszerek összehasonlítása közlekedési zajban történő beszédfelismerés céljából

Sárosi Gellért and Tobler Zoltán and Mihajlik Péter and Fegyó Tibor: Lényegkiemelő módszerek összehasonlítása közlekedési zajban történő beszédfelismerés céljából.

[thumbnail of msznykonf_007_384-388.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_007_384-388.pdf

Download (81kB) | Preview

Abstract

A gépi beszédfelismerés egyik dönt fontosságú eleme a beszéd akusztikai lényegének kiemelése, különösen a zajos környezetben történ alkalmazásoknál, amely jelen esetben közlekedési zajjal terhelt akusztikai környezetet jelentett. Emiatt helyeztük vizsgálatunk középpontjába a zajtr és hagyományos beszédfelismerési lényegkiemelési eljárásokat. A tanítást és tesztelést hat nyelven végeztük el: angol, francia, magyar, német, olasz, spanyol. Teszteléshez a telefonos hálózaton keresztül az utcáról vagy jármbl rögzített adatbázist használtunk. Alaprendszerként teszteltük a HTK és a SPHINX eszközkészletben, vagy általunk is implementált Mel Frequency Cepstral Coefficients (MFCC) és Perceptual Linear Prediction (PLP) módszereket. Az újabb módszerek között a Power-Normalized Cepstral Coefficients (PNCC) és a Perceptual Minimum Variance Distortionless Response (PMVDR) szerepel.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2010
Volume: 7
ISBN: 978-963-306-075-9
Page Range: pp. 384-388
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/58548/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 387-388. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 24. 09:08
Last Modified: 2022. Nov. 08. 11:50
URI: http://acta.bibl.u-szeged.hu/id/eprint/58781

Actions (login required)

View Item View Item