TY - CONF TI - Magyar nyelv? szó- és karakterszint? szóbeágyazások KW - Nyelvészet - számítógép alkalmazása SP - 323 UR - http://acta.bibl.u-szeged.hu/59021/ N2 - A szóbeágyazási modellek az egyes szavak párszáz dimenziós folytonos térbe való leképezését adják meg úgy, hogy az egymáshoz hasonló szavak közel kerülnek egymáshoz a beágyazási térben. A szóbeágyazások széles körben használatossá váltak az elmúlt években. Jelen cikkben bemutatunk publikusan elérhet? magyar nyelv? szóvektorokat, amelyeket 4,3 milliárd szövegszónyi korpuszból építettünk. Az els? modellek (word2vec) a szavakat mint alapegységet dolgozták fel. Az utóbbi években több olyan kiterjesztése is született ezen modelleknek, amelyek karakterszint? információkat is ki tudnak aknázni. Ezek a modellek morfológiailag gazdag nyelveken el?nyösebbek lehetnek, mint a pusztán szószint? modellek. A cikkben összehasonlítunk ugyanazon adatbázisból épített szó- és karakterszint? szóbeágyazásokat téma- és véleményosztályozási feladatokon kiértékelve. T2 - Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged) AV - public VL - 13 ID - acta59021 A1 - Szántó Zsolt A1 - Vincze Veronika A1 - Farkas Richárd SN - 978-963-306-518-1 Y1 - 2017/// N1 - Bibliogr.: p. 327-328. ; összefoglalás magyar nyelven EP - 328 ER -