Simon Eszter and Indig Balázs and Kalivoda Ágnes and Mittelholcz Iván and Sass Bálint and Vadász Noémi: Újabb fejlemények az e-magyar háza táján.
Preview |
Cikk, tanulmány, mű
msznykonf_016_029-042.pdf Download (502kB) | Preview |
Abstract
A cikkben az e-magyar nyelvfeldolgozó eszközlánc új verzióján, az emtsv-n végrehajtott fejlesztéseket mutatjuk be. Az emtsv fő tulajdonságai közé tartozik a teljes modularitás, amit az egységes formátum és keretrendszer tesz lehetővé. Ebből következik, hogy az emtsvbe könnyen lehet új modulokat integrálni, valamint az egyes elemzési lépéseknél be- és kiszállni. Ezt illusztrálandó egyrészt már létező eszközöket integráltunk (UDPipe, Hunspell), másrészt új modulokat fejlesztettünk (emTerm, emDiff, emZero), harmadrészt a már meglévő modulokat fejlesztettük tovább (detokenizálási funkció az emToken-ben). A cikkben ezeket mutatjuk be, továbbá az emtsv-t teljesítmény és gyorsaság szempontjából összehasonlítjuk hasonló funkcionalitásokkal bíró magyar nyelvfeldolgozó eszközláncokkal, mint a UDPipe, a huspaCy és a Magyarlánc. Az emtsv LGPL 3.0 licenc alatt elérhető a https://github. com/dlt-rilmta/emtsv GitHub repozitóriumból.
Item Type: | Conference or Workshop Item |
---|---|
Heading title: | Szemantika, NLP-eszközök |
Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
Date: | 2020 |
Volume: | 16 |
ISBN: | 978-963-306-719-2 |
Page Range: | pp. 29-42 |
Event Title: | Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) |
Related URLs: | http://acta.bibl.u-szeged.hu/67637/ |
Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása, Szemantika |
Additional Information: | Bibliogr.: p. 41-42. és a lábjegyzetekben ; összefoglalás magyar nyelven |
Date Deposited: | 2020. May. 04. 13:37 |
Last Modified: | 2022. Nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/67683 |
Actions (login required)
View Item |