Az automata és kézi szegmentálás ejtésvariációk okozta problémái

Zsigri Gyula; Tóth László; Kocsor András; Sejtes Györgyi: Az automata és kézi szegmentálás ejtésvariációk okozta problémái.

[thumbnail of msznykonf_002_327-334.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_002_327-334.pdf

Letöltés (1MB) | Előnézet

Absztrakt (kivonat)

A beszédadatbázisok egyik legértékesebb része a beszédhang szintű szegmentálás: információ. A szegmentálást és címkézést tökéletesen csakis nagy figyelmet igénylő, fáradságos és hosszadalmas kézi munkával lehet elvégezni. Megkönnyítheti és meggyorsíthatja viszont a munkát egy speciálisan erre a célra kialakított algoritmus, amely megkísérli automatikusan elhelyezni a fonetikai határokat. Akár ember, akár gép végzi a szegmentálást, segítségként rendelkezésére áll a hanganyag feltételezett fonetikai átirata, amelyet egy fonetikus átíró algoritmus állít elő a betű szerinti lejegyzésből. A jel valódi fonetikai tartalma azonban eltérhet ettől, hiszen ugyanannak a szövegnek ejtésvariációja lehet. A cikkben megvizsgáljuk, hogy ez a jelenség hogyan befolyásolja az általunk alkalmazott automata, illetve félautomata szegmentáló algoritmusokat. Megnézzük továbbá, hogy az MTBA adatbázis kézi feldolgozása során a szegmentálást végző személyek miben tértek el az előzetesen rögzített szabályoktól, különös tekintettel arra, hogy mentális (fonetikai) lexikonjuk hogyan befolyásolta őket a várttól eltérő ejtésvariációk kezelésében.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2004
Kötet: 2
Oldalak: pp. 327-334
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (2.) (2004) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/59177/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: 334. p. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. júl. 16. 11:44
Utolsó módosítás: 2022. nov. 08. 11:51
URI: http://acta.bibl.u-szeged.hu/id/eprint/59287
Bővebben:
Tétel nézet Tétel nézet