A magyar jelnyelvi korpusz létrehozásának és annotálásának kihívásai

Bartha, Csilla and Varjasi, Szabolcs and Holecz, Margit: A magyar jelnyelvi korpusz létrehozásának és annotálásának kihívásai. In: Magyar Számítógépes Nyelvészeti Konferencia, (10). pp. 207-219. (2016)

[img]
Preview
Cikk, tanulmány, mű
msznykonf_012_207-219.pdf

Download (129kB) | Preview

Abstract

A 2015. október 31-én zárult JelEsély Projekt keretében egy hozzávetőlegesen 1750 órányi jelnyelvi korpusz jött létre. Országos terepmunka során 147 szociolingvisztikai interjú készült 5 régióban és 9 helyszínen, 27 grammatikai teszt során pedig 54 adatközlővel készültek felvételek (interjúnként 2 adatközlővel). Ahhoz, hogy a létrejött videoalapú korpusz kereshető, kutatható és felhasználható legyen, szükség van egyrészt a korpusz annotálására, amely folyamat során különféle információkat kapcsolunk a felvételekhez, másrészt a jelnyelvi felvételek fordítására. Írásunkban a jelnyelvi korpuszépítés és annotáció egyedi kihívásait ismertetjük, melyek többsége két okra vezethető vissza, melyek összefüggenek a jelnyelvek sztenderdizációjának kérdéseivel is. Egyrészt a jelnyelveknek nincs kidolgozott és elfogadott írásrendszerük, másrészt a jelnyelvekre – a sztenderdizálatlan hangzó nyelvekhez hasonlóan –jellemző a nagyfokú változatosság. A kereshető, immár géppel is olvasható korpuszok számos további kutatási lehetőséget biztosítanak, az alapvető statisztikai vizsgálatokon túlmenően is. A szociolingvisztikai kutatások mellett lehetővé válik korpuszalapú szótár létrehozása, valamint egy valós nyelvhasználaton alapuló grammatika megalkotása is. Vizsgálhatóak továbbá diskurzusjelenségek, pragmatikai sajátosságok és a siketes jelek is. A korpusz ezen kívül oktatási célokat is szolgálhat, például tan-, és segédanyagok létrehozásával.

Item Type: Article
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2016
Volume: 10
ISBN: 978-963-306-450-4
Page Range: pp. 207-219
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 217-219. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 01. 11:13
Last Modified: 2019. Jul. 01. 11:13
URI: http://acta.bibl.u-szeged.hu/id/eprint/58976

Actions (login required)

View Item View Item