Magyar nyelvű klinikai dokumentumok előfeldolgozása

Siklósi Borbála and Orosz György and Novák Attila: Magyar nyelvű klinikai dokumentumok előfeldolgozása.

[thumbnail of msznykonf_008_143-152.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_008_143-152.pdf

Download (386kB) | Preview

Abstract

A klinikai dokumentumok feldolgozásának első lépése azok strukturálása és normalizálása. Bemutatjuk, hogy a szerkezeti egységek hiányát hogyan tudtuk a formázási jegyek alapján automatikus transzformációkkal pótolni, illetve alapvető metainformációkat a folyó szövegből kinyerni. Ezután a korpusz szöveges részeit elválasztottuk a nem szöveges részektől, az így kapott halmazra automatikus helyesírás-javító, illetve javaslatgeneráló rendszert hoztunk létre. Módszerünk elsősorban a rendelkezésünkre álló korpusz statisztikai viselkedésére épül, de külső erőforrásokat is bevontunk a jobb minőség elérése végett. Az algoritmust két funkciója: a helyesírás-javítás, illetve a javaslatgenerálás alapján értékeltük ki. Beláttuk, hogy módszerünk a teljesen automatikus javításra pillanatnyilag önmagában nem alkalmas, azonban ez nem is volt cél, viszont minimális emberi közreműködéssel hatékonyan alkalmazható egy helyes orvosi-klinikai korpusz létrehozására.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2011
Volume: 8
ISBN: 978-963-306-121-3
Page Range: pp. 143-152
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (8.) (2011) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/58549/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: 152. p. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 24. 11:20
Last Modified: 2022. Nov. 08. 11:50
URI: http://acta.bibl.u-szeged.hu/id/eprint/58797

Actions (login required)

View Item View Item