Siklósi Borbála; Orosz György; Novák Attila: Magyar nyelvű klinikai dokumentumok előfeldolgozása.
Előnézet |
Cikk, tanulmány, mű
msznykonf_008_143-152.pdf Letöltés (386kB) | Előnézet |
Absztrakt (kivonat)
A klinikai dokumentumok feldolgozásának első lépése azok strukturálása és normalizálása. Bemutatjuk, hogy a szerkezeti egységek hiányát hogyan tudtuk a formázási jegyek alapján automatikus transzformációkkal pótolni, illetve alapvető metainformációkat a folyó szövegből kinyerni. Ezután a korpusz szöveges részeit elválasztottuk a nem szöveges részektől, az így kapott halmazra automatikus helyesírás-javító, illetve javaslatgeneráló rendszert hoztunk létre. Módszerünk elsősorban a rendelkezésünkre álló korpusz statisztikai viselkedésére épül, de külső erőforrásokat is bevontunk a jobb minőség elérése végett. Az algoritmust két funkciója: a helyesírás-javítás, illetve a javaslatgenerálás alapján értékeltük ki. Beláttuk, hogy módszerünk a teljesen automatikus javításra pillanatnyilag önmagában nem alkalmas, azonban ez nem is volt cél, viszont minimális emberi közreműködéssel hatékonyan alkalmazható egy helyes orvosi-klinikai korpusz létrehozására.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2011 |
Kötet: | 8 |
ISBN: | 978-963-306-121-3 |
Oldalak: | pp. 143-152 |
Konferencia neve: | Magyar Számítógépes Nyelvészeti Konferencia (8.) (2011) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/58549/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr.: 152. p. ; összefoglalás magyar nyelven |
Feltöltés dátuma: | 2019. jún. 24. 11:20 |
Utolsó módosítás: | 2022. nov. 08. 11:50 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58797 |
![]() |
Tétel nézet |