Ligeti-Nagy Noémi; Dodé Réka; Jelencsik-Mátyus Kinga; Varga Zsófia; Héja Enikő; Váradi Tamás: A new ParlaMint corpus for Hungarian 30m tokens of annotated parliamentary data.
Előnézet |
Cikk, tanulmány, mű
msznykonf_019_433-446..pdf Letöltés (597kB) | Előnézet |
Absztrakt (kivonat)
Parliamentary data constitute a rich source for research for academic fields in the social sciences and humanities (SSH). To facilitate such research, comparable, high-quality parliamentary corpora are needed. The ParlaMint project, funded by CLARIN-ERIC, aims to create such corpora for languages spoken in European parliaments in a shared framework consisting of uniform encoding schemas, metadata structure, and Universal Dependencies-type linguistic annotation. The newly built Hungarian corpus of ParlaMint II focuses on the minutes of the Hungarian National Assembly between May 2014 and June 2022 and can be considered a major improvement from the Hungarian corpus of ParlaMint I. It has a wider time frame, more extensive metadata on speakers and their affiliations, and more sophisticated linguistic analysis than what was available in ParlaMint I. The Hungarian ParlaMint II corpus is openly available, just as all the ParlaMint corpora for other languages. Some potential applications of ParlaMint corpora in SSH research are also discussed.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2023 |
Kötet: | 19 |
ISBN: | 978-963-306-912-7 |
Oldalak: | pp. 433-446 |
Nyelv: | angol |
Kiadás helye: | Szeged |
Konferencia neve: | Magyar számítógépes nyelvészeti konferencia (19.) |
Konferencia típusa: | Konferencia |
Helyszin: | Szeged |
Dátum: | 2023. január 26-27. |
Befoglaló mű URL: | https://acta.bibl.u-szeged.hu/78307/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr.: p. 445-446. és a lábjegyzetekben ; összefoglalás magyar nyelven |
Szakterület: | 01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány 06. Bölcsészettudományok 06. Bölcsészettudományok > 06.02. Nyelvek és irodalom |
Feltöltés dátuma: | 2023. már. 16. 11:28 |
Utolsó módosítás: | 2023. már. 16. 11:28 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/78431 |
![]() |
Tétel nézet |