TY  - CONF
TI  - Magyar nyelv? szó- és karakterszint? szóbeágyazások
KW  - Nyelvészet - számítógép alkalmazása
SP  - 323
UR  - http://acta.bibl.u-szeged.hu/59021/
N2  - A szóbeágyazási modellek az egyes szavak párszáz dimenziós folytonos térbe való leképezését adják meg úgy, hogy az egymáshoz hasonló szavak közel kerülnek egymáshoz a beágyazási térben. A szóbeágyazások széles körben használatossá váltak az elmúlt években. Jelen cikkben bemutatunk publikusan elérhet? magyar nyelv? szóvektorokat, amelyeket 4,3 milliárd szövegszónyi korpuszból építettünk. Az els? modellek (word2vec) a szavakat mint alapegységet dolgozták fel. Az utóbbi években több olyan kiterjesztése is született ezen modelleknek, amelyek karakterszint? információkat is ki tudnak aknázni. Ezek a modellek morfológiailag gazdag nyelveken el?nyösebbek lehetnek, mint a pusztán szószint? modellek. A cikkben összehasonlítunk ugyanazon adatbázisból épített szó- és karakterszint? szóbeágyazásokat téma- és véleményosztályozási feladatokon kiértékelve.
T2  - Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged)
AV  - public
VL  - 13
ID  - acta59021
A1  -  Szántó Zsolt
A1  -  Vincze Veronika
A1  -  Farkas Richárd
SN  - 978-963-306-518-1
Y1  - 2017///
N1  - Bibliogr.: p. 327-328. ; összefoglalás magyar nyelven
EP  - 328
ER  -