Siklósi Borbála and Orosz György and Novák Attila: Magyar nyelvű klinikai dokumentumok előfeldolgozása.
Preview |
Cikk, tanulmány, mű
msznykonf_008_143-152.pdf Download (386kB) | Preview |
Abstract
A klinikai dokumentumok feldolgozásának első lépése azok strukturálása és normalizálása. Bemutatjuk, hogy a szerkezeti egységek hiányát hogyan tudtuk a formázási jegyek alapján automatikus transzformációkkal pótolni, illetve alapvető metainformációkat a folyó szövegből kinyerni. Ezután a korpusz szöveges részeit elválasztottuk a nem szöveges részektől, az így kapott halmazra automatikus helyesírás-javító, illetve javaslatgeneráló rendszert hoztunk létre. Módszerünk elsősorban a rendelkezésünkre álló korpusz statisztikai viselkedésére épül, de külső erőforrásokat is bevontunk a jobb minőség elérése végett. Az algoritmust két funkciója: a helyesírás-javítás, illetve a javaslatgenerálás alapján értékeltük ki. Beláttuk, hogy módszerünk a teljesen automatikus javításra pillanatnyilag önmagában nem alkalmas, azonban ez nem is volt cél, viszont minimális emberi közreműködéssel hatékonyan alkalmazható egy helyes orvosi-klinikai korpusz létrehozására.
| Item Type: | Conference or Workshop Item |
|---|---|
| Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
| Date: | 2011 |
| Volume: | 8 |
| ISBN: | 978-963-306-121-3 |
| Page Range: | pp. 143-152 |
| Event Title: | Magyar Számítógépes Nyelvészeti Konferencia (8.) (2011) (Szeged) |
| Related URLs: | http://acta.bibl.u-szeged.hu/58549/ |
| Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása |
| Additional Information: | Bibliogr.: 152. p. ; összefoglalás magyar nyelven |
| Date Deposited: | 2019. Jun. 24. 11:20 |
| Last Modified: | 2022. Nov. 08. 11:50 |
| URI: | http://acta.bibl.u-szeged.hu/id/eprint/58797 |
Actions (login required)
![]() |
View Item |

