%A SzĂĄntĂł Zsolt %A Vincze Veronika %A Farkas RichĂĄrd %K NyelvĂŠszet - szĂĄmĂtĂłgĂŠp alkalmazĂĄsa %L acta59021 %D 2017 %T Magyar nyelvĹą szĂł- ĂŠs karakterszintĹą szĂłbeĂĄgyazĂĄsok %V 13 %X A szĂłbeĂĄgyazĂĄsi modellek az egyes szavak pĂĄrszĂĄz dimenziĂłs folytonos tĂŠrbe valĂł lekĂŠpezĂŠsĂŠt adjĂĄk meg Ăşgy, hogy az egymĂĄshoz hasonlĂł szavak kĂśzel kerĂźlnek egymĂĄshoz a beĂĄgyazĂĄsi tĂŠrben. A szĂłbeĂĄgyazĂĄsok szĂŠles kĂśrben hasznĂĄlatossĂĄ vĂĄltak az elmĂşlt ĂŠvekben. Jelen cikkben bemutatunk publikusan elĂŠrhetĹ magyar nyelvĹą szĂłvektorokat, amelyeket 4,3 milliĂĄrd szĂśvegszĂłnyi korpuszbĂłl ĂŠpĂtettĂźnk. Az elsĹ modellek (word2vec) a szavakat mint alapegysĂŠget dolgoztĂĄk fel. Az utĂłbbi ĂŠvekben tĂśbb olyan kiterjesztĂŠse is szĂźletett ezen modelleknek, amelyek karakterszintĹą informĂĄciĂłkat is ki tudnak aknĂĄzni. Ezek a modellek morfolĂłgiailag gazdag nyelveken elĹnyĂśsebbek lehetnek, mint a pusztĂĄn szĂłszintĹą modellek. A cikkben ĂśsszehasonlĂtunk ugyanazon adatbĂĄzisbĂłl ĂŠpĂtett szĂł- ĂŠs karakterszintĹą szĂłbeĂĄgyazĂĄsokat tĂŠma- ĂŠs vĂŠlemĂŠnyosztĂĄlyozĂĄsi feladatokon kiĂŠrtĂŠkelve. %O Bibliogr.: p. 327-328. ; ĂśsszefoglalĂĄs magyar nyelven %J Magyar SzĂĄmĂtĂłgĂŠpes NyelvĂŠszeti Konferencia %P 323-328