"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények

Mihajlik Péter; Balog András; Gráczi Tekla Etelka; Kohári Anna; Fegyó Tibor; Mády Katalin: "Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények.

[thumbnail of msznykonf_018_199-210.pdf] Cikk, tanulmány, mű
msznykonf_018_199-210.pdf

Letöltés (328kB)

Absztrakt (kivonat)

Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ismertetjük az alkalmazott, legkorszerűbb beszédfelismerési technikákra épülő beszédfelismerés megközelítéseket, úgymint hibrid rejtett Markov-modell/mély neuronhálós fonéma és graféma alapú rendszerek, konvolúciós és rekurrens hálókra épülő enkóder-dekóder end-to-end rendszerek figyelmi mechanizmussal vagy anélkül. Végül eljutunk a kontrasztív, önfelügyelt módon előtanított súlyokkal inicializált transzformer alapú megközelítésig, amit BEAST-nek (BEA Speech Transcriber) neveztünk el. Utóbbi rendszer – köszönhetően az 53 ezer órás hanganyagon történt előtanításnak – a klasszikus megoldáshoz képest 40%-kal csökkenti a legrelevánsabb szó- és betűhibaarányt, valamint a magyar Common Voice tesztadatokon is versenyképes leiratot szolgáltat.

Mű típusa: Konferencia vagy workshop anyag
Rovatcím: Beszédtechnológia
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2022
Kötet: 18
ISBN: 978-963-306-848-9
Oldalak: pp. 199-210
Nyelv: magyar
Kiadás helye: Szeged
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/75797/
Kulcsszavak: Beszédtechnológia, Nyelvészet - számítógép alkalmazása, Mesterséges intelligencia, Gépi beszédfelismerés
Megjegyzések: Bibliogr.: p. 209-210. ; összefoglalás magyar nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06. Bölcsészettudományok > 06.02. Nyelvek és irodalom
Feltöltés dátuma: 2022. máj. 25. 09:17
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/75875
Bővebben:
Tétel nézet Tétel nézet