%A  SzĂĄntĂł Zsolt
%A  Vincze Veronika
%A  Farkas RichĂĄrd
%K NyelvĂŠszet - szĂĄmĂtĂłgĂŠp alkalmazĂĄsa
%L acta59021
%D 2017
%T Magyar nyelvĹą szĂł- ĂŠs karakterszintĹą szĂłbeĂĄgyazĂĄsok
%V 13
%X A szĂłbeĂĄgyazĂĄsi modellek az egyes szavak pĂĄrszĂĄz dimenziĂłs folytonos tĂŠrbe valĂł lekĂŠpezĂŠsĂŠt adjĂĄk meg Ăşgy, hogy az egymĂĄshoz hasonlĂł szavak kĂśzel kerĂźlnek egymĂĄshoz a beĂĄgyazĂĄsi tĂŠrben. A szĂłbeĂĄgyazĂĄsok szĂŠles kĂśrben hasznĂĄlatossĂĄ vĂĄltak az elmĂşlt ĂŠvekben. Jelen cikkben bemutatunk publikusan elĂŠrhetĹ magyar nyelvĹą szĂłvektorokat, amelyeket 4,3 milliĂĄrd szĂśvegszĂłnyi korpuszbĂłl ĂŠpĂtettĂźnk. Az elsĹ modellek (word2vec) a szavakat mint alapegysĂŠget dolgoztĂĄk fel. Az utĂłbbi ĂŠvekben tĂśbb olyan kiterjesztĂŠse is szĂźletett ezen modelleknek, amelyek karakterszintĹą informĂĄciĂłkat is ki tudnak aknĂĄzni. Ezek a modellek morfolĂłgiailag gazdag nyelveken elĹnyĂśsebbek lehetnek, mint a pusztĂĄn szĂłszintĹą modellek. A cikkben ĂśsszehasonlĂtunk ugyanazon adatbĂĄzisbĂłl ĂŠpĂtett szĂł- ĂŠs karakterszintĹą szĂłbeĂĄgyazĂĄsokat tĂŠma- ĂŠs vĂŠlemĂŠnyosztĂĄlyozĂĄsi feladatokon kiĂŠrtĂŠkelve.
%O Bibliogr.: p. 327-328. ; ĂśsszefoglalĂĄs magyar nyelven
%J Magyar SzĂĄmĂtĂłgĂŠpes NyelvĂŠszeti Konferencia
%P 323-328