Magyar nyelvű klinikai dokumentumok előfeldolgozása

Siklósi Borbála; Orosz György; Novák Attila: Magyar nyelvű klinikai dokumentumok előfeldolgozása.

[thumbnail of msznykonf_008_143-152.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_008_143-152.pdf

Letöltés (386kB) | Előnézet

Absztrakt (kivonat)

A klinikai dokumentumok feldolgozásának első lépése azok strukturálása és normalizálása. Bemutatjuk, hogy a szerkezeti egységek hiányát hogyan tudtuk a formázási jegyek alapján automatikus transzformációkkal pótolni, illetve alapvető metainformációkat a folyó szövegből kinyerni. Ezután a korpusz szöveges részeit elválasztottuk a nem szöveges részektől, az így kapott halmazra automatikus helyesírás-javító, illetve javaslatgeneráló rendszert hoztunk létre. Módszerünk elsősorban a rendelkezésünkre álló korpusz statisztikai viselkedésére épül, de külső erőforrásokat is bevontunk a jobb minőség elérése végett. Az algoritmust két funkciója: a helyesírás-javítás, illetve a javaslatgenerálás alapján értékeltük ki. Beláttuk, hogy módszerünk a teljesen automatikus javításra pillanatnyilag önmagában nem alkalmas, azonban ez nem is volt cél, viszont minimális emberi közreműködéssel hatékonyan alkalmazható egy helyes orvosi-klinikai korpusz létrehozására.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2011
Kötet: 8
ISBN: 978-963-306-121-3
Oldalak: pp. 143-152
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (8.) (2011) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58549/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: 152. p. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. jún. 24. 11:20
Utolsó módosítás: 2022. nov. 08. 11:50
URI: http://acta.bibl.u-szeged.hu/id/eprint/58797
Bővebben:
Tétel nézet Tétel nézet