Témaspecifikus gépi fordítórendszer minőségének javítása domain adaptáció segítségével

Laki László János: Témaspecifikus gépi fordítórendszer minőségének javítása domain adaptáció segítségével.

[thumbnail of msznykonf_015_073-082.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_015_073-082.pdf

Letöltés (542kB) | Előnézet

Absztrakt (kivonat)

A mély tanulásos módszerek elterjedése napjainkban nagymértékben megváltoztatta a gépi fordítások emberi megítélését. A statisztikai gépi fordítórendszerekkel (SMT) szemben a neurálishálózat-alapon működő architektúrák (NMT) sokkal olvashatóbb fordításokat generálnak, melyek a hivatásos fordítók számára könnyebben és hatékonyabban javíthatók az utófeldolgozás során. Az új módszer nehézsége azonban, hogy a stabilan jó fodítási minőséget adó rendszerek tanításához nagy méretű tanítóanyagra van szükség. Ez azonban a legtöbb fordítócég vagy nyelvpár esetén nem áll rendelkezésre. Munkám során a kicsi és jó minőségű in-domain tanítóanyagokat adatszelekció segítségével feldúsítottam egy nagy méretű out-of-domain korpusz leginkább hasonló szegmenseivel. Az így létrehozott architektúrával sikerült statisztikailag szignifikáns mértékben javítanom a fordítórendszer minőségét az összes vizsgált esetben. Kutatásom során igyekeztem megtalálni a feladathoz leginkább alkalmas szelekciós módszert, illetve megvizsgáltam a rendszer működését több különböző nyelv- és domainpár kombinációval.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2019
Kötet: 15
ISBN: 978-963-315-393-2
Oldalak: pp. 73-82
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58556/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 80-82. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. júl. 03. 11:47
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/59075
Bővebben:
Tétel nézet Tétel nézet