Ügyfélszolgálati beszélgetések nyelvmodellezése rekurrens neurális hálózatokkal

Tarján, Balázs and Fegyó, Tibor and Mihajlik, Péter: Ügyfélszolgálati beszélgetések nyelvmodellezése rekurrens neurális hálózatokkal. In: Magyar Számítógépes Nyelvészeti Konferencia, (13). pp. 23-33. (2019)

[img]
Preview
Cikk, tanulmány, mű
msznykonf_015_023-033.pdf

Download (573kB) | Preview

Abstract

A spontán, társalgási beszéd leírása a mai napig komoly kihívás elé állítja a gépi beszédfelismerő rendszereket. A témák sokszínűsége és a kevés tanítóadat különösen megnehezíti a nyelvi modellek tanítását. Cikkünkben telefonos ügyfélszolgálati beszélgetéseket modellezük rekurrens LSTM neurális hálózat segítségével, mellyel közel felére sikerült csökkentenünk a perplexitást a hagyományos, count n-gram modellhez képest. Azt találtuk, hogy a rekurrens LSTM akkor is felülmúlja a count modell pontosságát, ha memóriája hosszát alacsonyra korlátozzuk (LSTM n-gram). 10 vagy annál nagyobb fokszámú LSTM n-grammal pedig a korlátozás nélküli LSTM nyelvi modell teljesítménye is megközelíthető. Ez alapján arra következtetünk, hogy a rekurrens neurális nyelvi modellek pontosságának titka a hatékony simításban rejlik, nem a hosszú távú memóriában. Az új, neurális nyelvmodell segítségével nem csak a perplexitást sikerült csökkentenünk, hanem a kapcsolódó beszédfelismerési feladaton a szóhiba-arányt is relatív 4%-kal.

Item Type: Article
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2019
Volume: 13
ISBN: 978-963-315-393-2
Page Range: pp. 23-33
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged)
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 32-33.; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 03. 11:20
Last Modified: 2019. Jul. 03. 11:20
URI: http://acta.bibl.u-szeged.hu/id/eprint/59071

Actions (login required)

View Item View Item