A magyar beteg

Siklósi Borbála; Novák Attila: A magyar beteg.

[thumbnail of msznykonf_010_188-198.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_010_188-198.pdf

Letöltés (322kB) | Előnézet

Absztrakt (kivonat)

A klinikai szövegek feldolgozása aktív kutatási terület, melynek során az egyik legnagyobb kihívás az ilyen szövegek azon sajátosságainak a kezelése, amelyek tekintetében ezek az általános szövegektől jelentősen eltérnek. Ezek között szerepel többek között a sok szakszó és rövidítés, a szinte csak rövidítésekből és numerikus adatokból álló „mondatok”, valamint a jelentős számú helyesírási és központozási hiba, amelyből többek között a mondathatárok felismerésének rendkívül nehéz volta is következik. Cikkünkben bemutatjuk a rendelkezésünkre álló magyar klinikai korpusz jellemzőit, különös tekintettel az előbb említett tényezőkre, összevetve azt egy általános tartalmú magyar szövegeket tartalmazó korpusszal. A szövegek felszíni tulajdonságai mellett összehasonlításokat végeztünk a leggyakoribb szavak disztribúciós szemantikai viselkedése alapján is, melynek során a jelentésbeli különbségek is kimutathatóak a különböző korpuszok között.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2014
Kötet: 10
ISBN: 978-963-306-246-3
Oldalak: pp. 188-198
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (10.) (2014) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58551/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: 198. p. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. jún. 27. 09:06
Utolsó módosítás: 2022. nov. 08. 11:49
URI: http://acta.bibl.u-szeged.hu/id/eprint/58884
Bővebben:
Tétel nézet Tétel nézet