Újabb fejlemények az e-magyar háza táján

Simon Eszter; Indig Balázs; Kalivoda Ágnes; Mittelholcz Iván; Sass Bálint; Vadász Noémi: Újabb fejlemények az e-magyar háza táján.

[thumbnail of msznykonf_016_029-042.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_016_029-042.pdf

Letöltés (502kB) | Előnézet

Absztrakt (kivonat)

A cikkben az e-magyar nyelvfeldolgozó eszközlánc új verzióján, az emtsv-n végrehajtott fejlesztéseket mutatjuk be. Az emtsv fő tulajdonságai közé tartozik a teljes modularitás, amit az egységes formátum és keretrendszer tesz lehetővé. Ebből következik, hogy az emtsvbe könnyen lehet új modulokat integrálni, valamint az egyes elemzési lépéseknél be- és kiszállni. Ezt illusztrálandó egyrészt már létező eszközöket integráltunk (UDPipe, Hunspell), másrészt új modulokat fejlesztettünk (emTerm, emDiff, emZero), harmadrészt a már meglévő modulokat fejlesztettük tovább (detokenizálási funkció az emToken-ben). A cikkben ezeket mutatjuk be, továbbá az emtsv-t teljesítmény és gyorsaság szempontjából összehasonlítjuk hasonló funkcionalitásokkal bíró magyar nyelvfeldolgozó eszközláncokkal, mint a UDPipe, a huspaCy és a Magyarlánc. Az emtsv LGPL 3.0 licenc alatt elérhető a https://github. com/dlt-rilmta/emtsv GitHub repozitóriumból.

Mű típusa: Konferencia vagy workshop anyag
Rovatcím: Szemantika, NLP-eszközök
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2020
Kötet: 16
ISBN: 978-963-306-719-2
Oldalak: pp. 29-42
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/67637/
Kulcsszavak: Nyelvészet - számítógép alkalmazása, Szemantika
Megjegyzések: Bibliogr.: p. 41-42. és a lábjegyzetekben ; összefoglalás magyar nyelven
Feltöltés dátuma: 2020. máj. 04. 13:37
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/67683
Bővebben:
Tétel nézet Tétel nézet