"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények

Mihajlik Péter and Balog András and Gráczi Tekla Etelka and Kohári Anna and Fegyó Tibor and Mády Katalin: "Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények. In: Magyar Számítógépes Nyelvészeti Konferencia, (18). pp. 199-210. (2022)

[thumbnail of msznykonf_018_199-210.pdf] Cikk, tanulmány, mű
msznykonf_018_199-210.pdf

Download (328kB)

Abstract

Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ismertetjük az alkalmazott, legkorszerűbb beszédfelismerési technikákra épülő beszédfelismerés megközelítéseket, úgymint hibrid rejtett Markov-modell/mély neuronhálós fonéma és graféma alapú rendszerek, konvolúciós és rekurrens hálókra épülő enkóder-dekóder end-to-end rendszerek figyelmi mechanizmussal vagy anélkül. Végül eljutunk a kontrasztív, önfelügyelt módon előtanított súlyokkal inicializált transzformer alapú megközelítésig, amit BEAST-nek (BEA Speech Transcriber) neveztünk el. Utóbbi rendszer – köszönhetően az 53 ezer órás hanganyagon történt előtanításnak – a klasszikus megoldáshoz képest 40%-kal csökkenti a legrelevánsabb szó- és betűhibaarányt, valamint a magyar Common Voice tesztadatokon is versenyképes leiratot szolgáltat.

Item Type: Article
Heading title: Beszédtechnológia
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2022
Volume: 18
ISBN: 978-963-306-848-9
Page Range: pp. 199-210
Language: Hungarian
Place of Publication: Szeged
Event Title: Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/75797/
Uncontrolled Keywords: Beszédtechnológia, Nyelvészet - számítógép alkalmazása, Mesterséges intelligencia, Gépi beszédfelismerés
Additional Information: Bibliogr.: p. 209-210. ; összefoglalás magyar nyelven
Subjects: 01. Natural sciences
01. Natural sciences > 01.02. Computer and information sciences
06. Humanities
06. Humanities > 06.02. Languages and Literature
Date Deposited: 2022. May. 25. 09:17
Last Modified: 2022. May. 25. 09:17
URI: http://acta.bibl.u-szeged.hu/id/eprint/75875

Actions (login required)

View Item View Item