Vincze Veronika and Üveges István and Szabó Martina Katalin and Takács Károly: A magyar beszélt és írott nyelv különböző korpuszainak morfológiai és szófaji vizsgálata.
Preview |
Cikk, tanulmány, mű
msznykonf_017_169-182.pdf Download (382kB) | Preview |
Abstract
A tanulmányban egy nagyméretű, magyar, beszélt nyelvi adatbázist elemzünk, és annak morfológiai és szófaji sajátságait vetjük össze más írott nyelvi korpuszok sajátságaival. A HuTongue korpusz, amelyet manuálisan leiratoztattunk és annotáltattunk, elsősorban abból a célból készült, hogy egy alapvetően szociológusokból álló kutatócsoport a pletykadiskurzusok sajátosságait vizsgálhassa (Galántai és mtsai, 2018). A korpusz szövegei hétköznapi szituációkban, külső ingerektől elszigetelt környezetben keletkeztek (Gulyás és mtsai, 2018). Legjobb tudomásunk szerint a HuTongue az első olyan, nagyméretű, magyar beszélt nyelvi korpusz, amely szűretlenül tartalmazza az összes, az adott időszakban elhangzó rögzített beszélgetés részletesen annotált leiratát. Mivel az egyes beszélgetések esetenként több résztvevő oldalán is rögzítésre kerültek, így a duplikátumok kezelése a feldolgozás egy fontos, nem triviális lépése volt. A jelen részletesen tárgyalja e munkafázis megfontolásait és módszereit. Ezt követően bemutatja a létrejövő korpusz statisztikai, köztük morfológiai és szófaji alapadatait, összevetve néhány más írott korpusz alapvető adataival. Azt reméljük, hogy a korpuszunk hatékonyan támogatja majd számos különféle szociológiai és nyelvészeti probléma korpuszalapú kutatását a jövőben.
Item Type: | Conference or Workshop Item |
---|---|
Heading title: | Spontán beszéd, chat |
Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
Date: | 2021 |
Volume: | 17 |
ISBN: | 978-963-306-781-9 |
Page Range: | pp. 169-182 |
Language: | Hungarian |
Event Title: | Magyar számítógépes nyelvészeti konferencia (17.) (2021) (Szeged) |
Related URLs: | http://acta.bibl.u-szeged.hu/73340/ |
Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása |
Additional Information: | Bibliogr.: p. 180-182. és a lábjegyzetekben ; összefoglalás magyar nyelven |
Subjects: | 01. Natural sciences 01. Natural sciences > 01.02. Computer and information sciences 06. Humanities 06. Humanities > 06.02. Languages and Literature |
Date Deposited: | 2021. Sep. 28. 12:25 |
Last Modified: | 2022. Nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/73366 |
Actions (login required)
View Item |