Zainkó Csaba; Csapó Tamás Gábor; Bartalis Mátyás; Németh Géza; Németh Norbert; Szász Gábor Krisztián; Szviridov István: Magyar nyelvű neurális beszédszintézis vizsgálata dialógus helyzetben.
Előnézet |
Cikk, tanulmány, mű
msznykonf_019_145-158..pdf Letöltés (669kB) | Előnézet |
Absztrakt (kivonat)
Jelen tanulmányban olyan mély neurális hálózat alapú beszédszintetizátor rendszert (DNN-TTS) mutatunk be, amely hangsorozat bemenetet vár és a beszéd hullámformáját két lépésben állítja elő, melspektrogram köztes reprezentációt használva. Részletesen bemutatjuk és összehasonlítotjuk a Tacotron2+WaveGlow és FastPitch+HiFi-GAN (tőlünk független) rendszereket és komponenseiket. A magyar nyelvű adatokon végzett saját kísérletekben három beszélővel (két női és egy férfi) generálunk szintezitált beszédmintákat. Szubjektív, MUSHRA típusú meghallgatásos tesztjeink során a tesztalanyok a DNN-TTS beszédszintetizátorral előállított mondatokat lényegesen természetesebbnek minősítették, mint a HMM-TTS alaprendszert. A szintetizált beszédminták minősége (természetessége) ugyan nem éri el a természetes beszéd szintjét, de közel áll hozzá (Tacotron2: 58%, FastPitch: 73%, természetes: 89%). Összességében a tesztelők a FastPitch rendszert preferálták a Tacotron2-vel szemben természetesség szempontjából. A ChatBot dialógusba ágyazott tesztek eredménye szerint a női beszélők preferáltak, és a DNN-TTS rendszerekkel előállított beszéd érthetőbb, természetesebb, mint a HMM-TTS alaprendszer, és tesztelők a válaszokat is relevánsabbnak és részletesebbnek érezték az alaprendszerhez képest.
| Mű típusa: | Konferencia vagy workshop anyag |
|---|---|
| Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
| Dátum: | 2023 |
| Kötet: | 19 |
| ISBN: | 978-963-306-912-7 |
| Oldalak: | pp. 145-158 |
| Nyelv: | magyar |
| Kiadás helye: | Szeged |
| Konferencia neve: | Magyar számítógépes nyelvészeti konferencia (19.) |
| Konferencia típusa: | Konferencia |
| Helyszin: | Szeged |
| Dátum: | 2023. január 26-27. |
| Befoglaló mű URL: | https://acta.bibl.u-szeged.hu/78307/ |
| Kulcsszavak: | Nyelvészet - számítógép alkalmazása, Beszédtechnológia |
| Megjegyzések: | Bibliogr.: p. 157-158. ; ill. ; összefoglalás magyar nyelven |
| Szakterület: | 01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány 06. Bölcsészettudományok 06. Bölcsészettudományok > 06.02. Nyelvek és irodalom |
| Feltöltés dátuma: | 2023. már. 16. 07:53 |
| Utolsó módosítás: | 2023. már. 16. 07:53 |
| URI: | http://acta.bibl.u-szeged.hu/id/eprint/78410 |
![]() |
Tétel nézet |

