Laki László János: Témaspecifikus gépi fordítórendszer minőségének javítása domain adaptáció segítségével.
Preview |
Cikk, tanulmány, mű
msznykonf_015_073-082.pdf Download (542kB) | Preview |
Abstract
A mély tanulásos módszerek elterjedése napjainkban nagymértékben megváltoztatta a gépi fordítások emberi megítélését. A statisztikai gépi fordítórendszerekkel (SMT) szemben a neurálishálózat-alapon működő architektúrák (NMT) sokkal olvashatóbb fordításokat generálnak, melyek a hivatásos fordítók számára könnyebben és hatékonyabban javíthatók az utófeldolgozás során. Az új módszer nehézsége azonban, hogy a stabilan jó fodítási minőséget adó rendszerek tanításához nagy méretű tanítóanyagra van szükség. Ez azonban a legtöbb fordítócég vagy nyelvpár esetén nem áll rendelkezésre. Munkám során a kicsi és jó minőségű in-domain tanítóanyagokat adatszelekció segítségével feldúsítottam egy nagy méretű out-of-domain korpusz leginkább hasonló szegmenseivel. Az így létrehozott architektúrával sikerült statisztikailag szignifikáns mértékben javítanom a fordítórendszer minőségét az összes vizsgált esetben. Kutatásom során igyekeztem megtalálni a feladathoz leginkább alkalmas szelekciós módszert, illetve megvizsgáltam a rendszer működését több különböző nyelv- és domainpár kombinációval.
Item Type: | Conference or Workshop Item |
---|---|
Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
Date: | 2019 |
Volume: | 15 |
ISBN: | 978-963-315-393-2 |
Page Range: | pp. 73-82 |
Event Title: | Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged) |
Related URLs: | http://acta.bibl.u-szeged.hu/58556/ |
Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása |
Additional Information: | Bibliogr.: p. 80-82. ; összefoglalás magyar nyelven |
Date Deposited: | 2019. Jul. 03. 11:47 |
Last Modified: | 2022. Nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/59075 |
Actions (login required)
![]() |
View Item |