Magyar nyelvű klinikai dokumentumok előfeldolgozása

Siklósi, Borbála and Orosz, György and Novák, Attila: Magyar nyelvű klinikai dokumentumok előfeldolgozása. Magyar Számítógépes Nyelvészeti Konferencia, (6). pp. 143-152. (2011)

[img] Cikk, tanulmány, mű
msznykonf_008_143-152.pdf

Download (386kB)

Abstract

A klinikai dokumentumok feldolgozásának első lépése azok strukturálása és normalizálása. Bemutatjuk, hogy a szerkezeti egységek hiányát hogyan tudtuk a formázási jegyek alapján automatikus transzformációkkal pótolni, illetve alapvető metainformációkat a folyó szövegből kinyerni. Ezután a korpusz szöveges részeit elválasztottuk a nem szöveges részektől, az így kapott halmazra automatikus helyesírás-javító, illetve javaslatgeneráló rendszert hoztunk létre. Módszerünk elsősorban a rendelkezésünkre álló korpusz statisztikai viselkedésére épül, de külső erőforrásokat is bevontunk a jobb minőség elérése végett. Az algoritmust két funkciója: a helyesírás-javítás, illetve a javaslatgenerálás alapján értékeltük ki. Beláttuk, hogy módszerünk a teljesen automatikus javításra pillanatnyilag önmagában nem alkalmas, azonban ez nem is volt cél, viszont minimális emberi közreműködéssel hatékonyan alkalmazható egy helyes orvosi-klinikai korpusz létrehozására.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (8.) (2011) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2011
Volume: 6
Page Range: pp. 143-152
ISBN: 978-963-306-121-3
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: 152. p. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 24. 11:20
Last Modified: 2019. Jun. 24. 11:20
URI: http://acta.bibl.u-szeged.hu/id/eprint/58797

Actions (login required)

View Item View Item