Mély neuronhálós beszédfelismerők GMM-mentes tanítása

Grósz, Tamás and Gosztolya, Gábor and Tóth, László: Mély neuronhálós beszédfelismerők GMM-mentes tanítása. Magyar Számítógépes Nyelvészeti Konferencia, (11). pp. 170-180. (2017)

[img] Cikk, tanulmány, mű
msznykonf_013_170-180.pdf

Download (301kB)

Abstract

Az utóbbi pár évben a beszédfelismerőkben használt rejtett Markov modellekben (hidden Markov model, HMM) az ún. Gauss-keverékmodell (gaussian mixture model, GMM) komponenst leváltották a mély neuronhálók (deep neural network, DNN). Ugyanakkor ezek az új, neuronálókra épülő hibrid HMM/DNN felismerők számos olyan algoritmust megörököltek, melyeket eredetileg GMM-alapú rendszerekhez fejlesztettek ki, és így optimalitásuk az új környezetben nem garantált. A HMM/DNN modellek `GMM-mentes' tanításához két részfeladatra kell új megoldást adnunk. Az egyik, hogy a mély hálók időben illesztett tanító ímkéket igényelnek, a másik pedig a környezetfüggő állapotok előállítása, amelyre a klasszikus megoldás egy GMM-alapú klaszterezési algoritmus. Bár a HMM/DNN hibridek tanítására léteznek teljes mondatokon dolgozó ún. szekven ia-diszkriminatív tanítóalgoritmusok, ezeket jellemzően sak a tanítás legutolsó fázisában, a modellek �nomhangolására szokták bevetni, míg a tanítás elején HMM/GMM modellekel el®állított és illesztett ímkékből indulnak ki. Jelen ikkünkben viszont megmutatjuk, hogy megfelelő oda�gyeléssel a szekven iatanuló algoritmusok a tanítás legelejétől használhatóak. Az állapotklaszterezési lépésre korábban már javasoltunk egy GMM-mentes megoldást, így a ímkeillesztési feladat megoldásával egy teljesen GMM-mentes tanítási sémához jutottunk. Kísérleti eredményeink azt mutatják, hogy a javasolt megoldás nem sak gyorsabb, mint a hagyományos tanítási módszer, hanem valamivel jobb felismerési pontosságot is eredményez.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2017
Volume: 11
Page Range: pp. 170-180
ISBN: 978-963-306-518-1
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 179-180. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 02. 13:27
Last Modified: 2019. Jul. 02. 13:27
URI: http://acta.bibl.u-szeged.hu/id/eprint/59007

Actions (login required)

View Item View Item