relation: http://acta.bibl.u-szeged.hu/58970/
title: Gépi beszéd természetességének növelése automatikus, beszédjel alapú hangsúlycímkéző algoritmussal
creator:  Szaszák György
creator:  Beke András
creator:  Olaszy Gábor
creator:  Tóth Bálint
description: A minél természetesebb hangzás elérése a géppel előállított beszédben napjainkban is igen fontos kutatási terület. A hangzás természetességét számos más tényező mellett a prozódia is nagyban befolyásolja, ezért alapvető követelmény egy olyan, precízen annotált korpusz megléte, amely alapján gépi tanulással pontos generatív modelleket állíthatunk elő. A korpusz kézi címkézése költséges és hosszadalmas, még a prozódiai egységekre, hangsúlyokra vonatkozóan is, ráadásul nemzetközi tapasztalatok is igazolják, hogy a szakértő címkézők ítélete is szubjektív, hiszen a különböző szakértők által előállított hangsúlyozásra vonatkozó annotációk közötti átfedés ritkán haladja meg a 80%-ot. A fentiek miatt gyakran használnak automatikus címkéző eljárásokat. A hangsúlycímkézést leggyakrabban a szöveges átirat alapján végzik el, ami azonban szerényebb pontosságot szolgáltat az emberi annotáláshoz képest. Alternatívaként jelen munkában egy beszédjel alapú hangsúlycímkéző algoritmust valósítunk meg. Az így nyert hangsúlycímkézés ellenőrzésére hat (3-3 férfi és női) HMM-TTS rendszert tanítunk, majd szubjektív lehallgatási tesztekkel (CMOS) hasonlítjuk össze a rendszereket.
date: 2016
type: Konferencia vagy workshop anyag
type: NonPeerReviewed
format: part
language: hu
identifier: http://acta.bibl.u-szeged.hu/58970/1/msznykonf_012_144-153.pdf
identifier:    Szaszák György;  Beke András;  Olaszy Gábor;  Tóth Bálint:   Gépi beszéd természetességének növelése automatikus, beszédjel alapú hangsúlycímkéző algoritmussal.