Magyar nyelvű neurális beszédszintézis vizsgálata dialógus helyzetben

Zainkó Csaba and Csapó Tamás Gábor and Bartalis Mátyás and Németh Géza and Németh Norbert and Szász Gábor Krisztián and Szviridov István: Magyar nyelvű neurális beszédszintézis vizsgálata dialógus helyzetben.

[thumbnail of msznykonf_019_145-158..pdf]
Preview
Cikk, tanulmány, mű
msznykonf_019_145-158..pdf

Download (669kB) | Preview

Abstract

Jelen tanulmányban olyan mély neurális hálózat alapú beszédszintetizátor rendszert (DNN-TTS) mutatunk be, amely hangsorozat bemenetet vár és a beszéd hullámformáját két lépésben állítja elő, melspektrogram köztes reprezentációt használva. Részletesen bemutatjuk és összehasonlítotjuk a Tacotron2+WaveGlow és FastPitch+HiFi-GAN (tőlünk független) rendszereket és komponenseiket. A magyar nyelvű adatokon végzett saját kísérletekben három beszélővel (két női és egy férfi) generálunk szintezitált beszédmintákat. Szubjektív, MUSHRA típusú meghallgatásos tesztjeink során a tesztalanyok a DNN-TTS beszédszintetizátorral előállított mondatokat lényegesen természetesebbnek minősítették, mint a HMM-TTS alaprendszert. A szintetizált beszédminták minősége (természetessége) ugyan nem éri el a természetes beszéd szintjét, de közel áll hozzá (Tacotron2: 58%, FastPitch: 73%, természetes: 89%). Összességében a tesztelők a FastPitch rendszert preferálták a Tacotron2-vel szemben természetesség szempontjából. A ChatBot dialógusba ágyazott tesztek eredménye szerint a női beszélők preferáltak, és a DNN-TTS rendszerekkel előállított beszéd érthetőbb, természetesebb, mint a HMM-TTS alaprendszer, és tesztelők a válaszokat is relevánsabbnak és részletesebbnek érezték az alaprendszerhez képest.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2023
Volume: 19
ISBN: 978-963-306-912-7
Page Range: pp. 145-158
Language: Hungarian
Place of Publication: Szeged
Event Title: Magyar számítógépes nyelvészeti konferencia (19.)
Event Type: Conference
Event Location: Szeged
Event Dates: 2023. január 26-27.
Related URLs: https://acta.bibl.u-szeged.hu/78307/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása, Beszédtechnológia
Additional Information: Bibliogr.: p. 157-158. ; ill. ; összefoglalás magyar nyelven
Subjects: 01. Natural sciences
01. Natural sciences > 01.02. Computer and information sciences
06. Humanities
06. Humanities > 06.02. Languages and Literature
Date Deposited: 2023. Mar. 16. 07:53
Last Modified: 2023. Mar. 16. 07:53
URI: http://acta.bibl.u-szeged.hu/id/eprint/78410

Actions (login required)

View Item View Item