A HuSpaCy és e-magyar elemzőláncok teljesítményének átfogó összehasonlítása országgyűlési szövegeken: a tokenizálástól a függőségi elemzésig

Skrabák Boglárka; Ligeti-Nagy Noémi: A HuSpaCy és e-magyar elemzőláncok teljesítményének átfogó összehasonlítása országgyűlési szövegeken: a tokenizálástól a függőségi elemzésig.

[thumbnail of msznykonf_021_171-184.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_021_171-184.pdf

Letöltés (169kB) | Előnézet

Absztrakt (kivonat)

A magyar nyelv számítógépes feldolgozásához megbízható elemzőrendszerekre van szükség, amelyek különböző nyelvi szinteken képesek pontos kimenetet biztosítani. Jelen tanulmány célja, hogy részletes összehasonlítást nyújtson két kiemelkedő magyar nyelvi elemzőrendszer, a HuSpaCy és az e-magyar teljesítményéről több szempontból, ideértve a tokenizálást, a szófaji címkézést, a morfoszintaktikai elemzést és a névelem-felismerést. Az elemzéseinket a magyar országgyűlési jegyzőkönyvek egy szövegrészén végeztük, amely lehetőséget nyújtott a rendszerek tesztelésére formailag és nyelvileg változatos szövegeken. Eredményeink segítséget nyújthatnak a nyelvi feldolgozó eszközök felhasználóinak abban, hogy a specifikus nyelvi alkalmazási igényeiknek legmegfelelőbb rendszert válasszák. A tanulmány rámutat az elemzők erősségeire és hiányosságaira, melyek alapján továbbfejleszthetők a magyar nyelvre irányuló nyelvtechnológiai megoldások.

Mű típusa: Konferencia vagy workshop anyag
Rovatcím: Korpusz, nyelvi elemzés
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2025
Kötet: 21
ISBN: 978-963-688-034-7
Oldalak: pp. 171-184
Nyelv: magyar
Kiadó: Szegedi Tudományegyetem TTIK, Informatikai Intézet
Kiadás helye: Szeged
Konferencia neve: Magyar számítógépes nyelvészeti konferencia (21.)
Konferencia típusa: Konferencia
Helyszin: Szeged
Dátum: 2025. február 6-7.
Befoglaló mű URL: https://acta.bibl.u-szeged.hu/88748/
Kulcsszavak: Nyelvfeldolgozás, Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 183-184. és a lábjegyzetekben ; ill. ; összefoglalás magyar nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06. Bölcsészettudományok > 06.02. Nyelvek és irodalom
Feltöltés dátuma: 2025. nov. 12. 13:30
Utolsó módosítás: 2025. nov. 12. 13:30
URI: http://acta.bibl.u-szeged.hu/id/eprint/88780
Bővebben:
Tétel nézet Tétel nézet