Magyarcentrikus többnyelvű gépifordító rendszerek létrehozása

Laki László János; Yang Zijian Győző: Magyarcentrikus többnyelvű gépifordító rendszerek létrehozása.

[thumbnail of msznykonf_019_369-380..pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_019_369-380..pdf

Letöltés (524kB) | Előnézet

Absztrakt (kivonat)

Kutatásunkban magyarcentrikus többnyelvű gépifordító rendszereket hoztunk létre. Egy konkrét projekt folytatásaként terjesztettük ki a kétnyelvű kísérleteinket többnyelvű modellekre. A projekt célja az volt, hogy 12 különböző nyelvről lehessen magyarra fordítani lehetőleg egy neurális modell alkalmazásával. Kutatásunk során betanítottunk egy előtudás nélküli Marian NMT gépifordító rendszert, valamint sikerült finomhangolnunk az M2M100 és az NLLB-200 többnyelvű előtanított modelleket. Az általunk létrehozott modelleket végül egymással, valamint különböző ipari rendszerekkel hasonlítottuk össze. A saját teszt korpuszunkon az M2M100 finomhangolt modell érte el a legjobb eredményt. A előtanított modelljeinket nyelvenként csupán 3 millió szegmenspárral és 1 epoch értékkel hangoltuk, további tanítóadat vagy tanítási lépés hozzáadásával tovább növelhető a minőségük. Kutatásunkban bemutattuk, hogy az angolcentrikus többnyelvű modellek áthangolhatóak magyarcentrikusra.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2023
Kötet: 19
ISBN: 978-963-306-912-7
Oldalak: pp. 369-380
Nyelv: magyar
Kiadás helye: Szeged
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (19.)
Konferencia típusa: Konferencia
Helyszin: Szeged
Dátum: 2023. január 26-27.
Befoglaló mű URL: https://acta.bibl.u-szeged.hu/78307/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 378-380. és a lábjegyzetekben ; ill. ; összefoglalás magyar nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma: 2023. már. 16. 10:52
Utolsó módosítás: 2023. már. 16. 10:52
URI: http://acta.bibl.u-szeged.hu/id/eprint/78426
Bővebben:
Tétel nézet Tétel nézet