"A fatens felelt pedig..." - A Történeti Magánéleti Korpusz igei szerkezeteinek mozaik n-gram alapú feldolgozása

Bajzát Tímea Borbála; Indig Balázs; Kalivoda Ágnes: "A fatens felelt pedig..." - A Történeti Magánéleti Korpusz igei szerkezeteinek mozaik n-gram alapú feldolgozása.

[thumbnail of msznykonf_020_043-058.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_020_043-058.pdf

Letöltés (356kB) | Előnézet

Absztrakt (kivonat)

A jelen tanulmány bemutatja a mozaik n-gram módszer alkalmazásának első eredményeit a Történeti Magánéleti Korpusz nyelvi anyagán. Az esettanulmány célja a finit igét tartalmazó elemi mondatok mintázatainak feltérképezése és konstrukciójelöltjeinek kinyerése. A funkcionális konstrukciós nyelvtan módszeréhez illeszkedő eljárás korábban alkalmazhatónak bizonyult infinitívuszos szerkezetek nyelvi mintázatainak azonosítására mai magyar nyelvi adatok elemzésénél. A konstrukciójelöltek félautomatikus módszerrel történő feltárása szükségszerű, mivel így kevésbé szükséges a nyelvész intuíciójára hagyatkozni. A mozaik n-gramok esetében a kinyert sorozatok elemei eltérő reprezentációs szinteken jelennek meg (szóalak, lemma, POS-tag), amely lehetővé teszi a nyelvi mintázatok eltérő absztrakciós szinteken történő azonosítását. Az eljárás diakrón korpuszokon történő alkalmazása segíti azt, hogy a konstrukciójelöltek feltárásán és egységes osztályozásán keresztül képesek legyünk hozzájárulni a magyar igei szerkezetek grammatikalizációs ösvényeinek adatalapú vizsgálatához. A tanulmány problémacentrikusan mutatja be az adaptációs folyamat kihívásaira (pl. annotációs séma egységesítése, elemi mondatok kinyerése) adott megoldásokat és a kapott eredményeket.

Mű típusa: Konferencia vagy workshop anyag
Rovatcím: Előfeldolgozás, szintaxis
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2024
Kötet: 20
ISBN: 978-963-306-973-8
Oldalak: pp. 43-58
Nyelv: magyar
Kiadó: Szegedi Tudományegyetem TTIK, Informatikai Intézet
Kiadás helye: Szeged
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (20.)
Konferencia típusa: Konferencia
Helyszin: Szeged
Dátum: 2024. január 25-26.
Befoglaló mű URL: https://acta.bibl.u-szeged.hu/88747/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 56-58. ; összefoglalás magyar nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06. Bölcsészettudományok > 06.02. Nyelvek és irodalom
Feltöltés dátuma: 2025. nov. 12. 08:26
Utolsó módosítás: 2025. nov. 12. 08:26
URI: http://acta.bibl.u-szeged.hu/id/eprint/88752
Bővebben:
Tétel nézet Tétel nézet