A duplakocka modell és az igei szerkezeteket kinyerő "ugrik és marad" módszer nyelvfüggetlensége, valamint néhány megjegyzés az UD annotáció univerzalitásáról

Sass Bálint: A duplakocka modell és az igei szerkezeteket kinyerő "ugrik és marad" módszer nyelvfüggetlensége, valamint néhány megjegyzés az UD annotáció univerzalitásáról.

[thumbnail of msznykonf_016_399-407.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_016_399-407.pdf

Download (441kB) | Preview

Abstract

Jelen tanulmány egy módszernek a magyartól különböző nyelvekre való alkalmazhatóságát vizsgálja. A (Sass, 2019) tanulmány egy valódi igei szerkezetek kinyerésére szolgáló eljárást mutat be magyar nyelvre, és két állítást fogalmaz meg mellékesen: (1) a módszer tetszőleges nyelvre alkalmazható; (2) a módszer alkalmazásához szükséges adatok függőségileg elemzett korpuszból könnyen származtathatók. E két állítást vesszük górcső alá. Adatként universal dependencies (UD) korpuszokat használunk fel. Az UD-nek köszönhetően annotációs különbségek elvileg nincsenek nincsenek a különféle nyelvű korpuszok között, csak a nettó nyelvi különbségek láthatók. Ezzel kapcsolatban gyakorlati megfigyeléseink alapján kritikát fogalmazunk meg. Bár az ige és közvetlen bővítményei közötti viszonyokat különböző nyelvek különböző eszközökkel fejezik ki, a vizsgált nyelvekre ezek a nyelvi eszközök néhány általános módon megragadhatók: esetrag, elöljáró/névutó (esetraggal vagy anélkül), szórend. Az említett eljárás működésének egyetlen feltétele az igék és közvetlen bővítményeik közötti viszonyok leírása, a fentiek alapján tehát működtethető az algoritmus. Eredményként valódi igei szerkezeket kapunk, azaz az eredmények igazolják sejtésünket, az eredeti cikk állításai megállják a helyüket.

Item Type: Conference or Workshop Item
Heading title: Korpusznyelvészet, szintaxis
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2020
Volume: 16
ISBN: 978-963-306-719-2
Page Range: pp. 399-407
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/67637/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása, Korpusz - nyelvészet
Additional Information: Bibliogr.: 407. p. ; összefoglalás magyar nyelven
Date Deposited: 2020. May. 05. 12:05
Last Modified: 2022. Nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/67654

Actions (login required)

View Item View Item