Siklósi Borbála and Novák Attila: A magyar beteg.
Preview |
Cikk, tanulmány, mű
msznykonf_010_188-198.pdf Download (322kB) | Preview |
Abstract
A klinikai szövegek feldolgozása aktív kutatási terület, melynek során az egyik legnagyobb kihívás az ilyen szövegek azon sajátosságainak a kezelése, amelyek tekintetében ezek az általános szövegektől jelentősen eltérnek. Ezek között szerepel többek között a sok szakszó és rövidítés, a szinte csak rövidítésekből és numerikus adatokból álló „mondatok”, valamint a jelentős számú helyesírási és központozási hiba, amelyből többek között a mondathatárok felismerésének rendkívül nehéz volta is következik. Cikkünkben bemutatjuk a rendelkezésünkre álló magyar klinikai korpusz jellemzőit, különös tekintettel az előbb említett tényezőkre, összevetve azt egy általános tartalmú magyar szövegeket tartalmazó korpusszal. A szövegek felszíni tulajdonságai mellett összehasonlításokat végeztünk a leggyakoribb szavak disztribúciós szemantikai viselkedése alapján is, melynek során a jelentésbeli különbségek is kimutathatóak a különböző korpuszok között.
Item Type: | Conference or Workshop Item |
---|---|
Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
Date: | 2014 |
Volume: | 10 |
ISBN: | 978-963-306-246-3 |
Page Range: | pp. 188-198 |
Event Title: | Magyar Számítógépes Nyelvészeti Konferencia (10.) (2014) (Szeged) |
Related URLs: | http://acta.bibl.u-szeged.hu/58551/ |
Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása |
Additional Information: | Bibliogr.: 198. p. ; összefoglalás magyar nyelven |
Date Deposited: | 2019. Jun. 27. 09:06 |
Last Modified: | 2022. Nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58884 |
Actions (login required)
![]() |
View Item |