relation: http://acta.bibl.u-szeged.hu/58970/ title: Gépi beszéd természetességének növelése automatikus, beszédjel alapú hangsúlycímkéző algoritmussal creator: Szaszák György creator: Beke András creator: Olaszy Gábor creator: Tóth Bálint description: A minél természetesebb hangzás elérése a géppel előállított beszédben napjainkban is igen fontos kutatási terület. A hangzás természetességét számos más tényező mellett a prozódia is nagyban befolyásolja, ezért alapvető követelmény egy olyan, precízen annotált korpusz megléte, amely alapján gépi tanulással pontos generatív modelleket állíthatunk elő. A korpusz kézi címkézése költséges és hosszadalmas, még a prozódiai egységekre, hangsúlyokra vonatkozóan is, ráadásul nemzetközi tapasztalatok is igazolják, hogy a szakértő címkézők ítélete is szubjektív, hiszen a különböző szakértők által előállított hangsúlyozásra vonatkozó annotációk közötti átfedés ritkán haladja meg a 80%-ot. A fentiek miatt gyakran használnak automatikus címkéző eljárásokat. A hangsúlycímkézést leggyakrabban a szöveges átirat alapján végzik el, ami azonban szerényebb pontosságot szolgáltat az emberi annotáláshoz képest. Alternatívaként jelen munkában egy beszédjel alapú hangsúlycímkéző algoritmust valósítunk meg. Az így nyert hangsúlycímkézés ellenőrzésére hat (3-3 férfi és női) HMM-TTS rendszert tanítunk, majd szubjektív lehallgatási tesztekkel (CMOS) hasonlítjuk össze a rendszereket. date: 2016 type: Konferencia vagy workshop anyag type: NonPeerReviewed format: part language: hu identifier: http://acta.bibl.u-szeged.hu/58970/1/msznykonf_012_144-153.pdf identifier: Szaszák György; Beke András; Olaszy Gábor; Tóth Bálint: Gépi beszéd természetességének növelése automatikus, beszédjel alapú hangsúlycímkéző algoritmussal.