Magyar szövegek természetes nyelvi előfeldolgozása

Miháczi, András and Németh, László and Rácz, Miklós: Magyar szövegek természetes nyelvi előfeldolgozása. Magyar Számítógépes Nyelvészeti Konferencia, (1). pp. 38-43. (2003)

[img] Cikk, tanulmány, mű
msznykonf_001_038-043.pdf

Download (476kB)

Abstract

A természetes nyelvi szövegek előfeldolgozásának feladata a szöveg mondatokra, szavakra bontása, tokenizálása (tokennek nevezzük a legkisebb önálló jelentéssel biró szövegegységet). Ehhez szorosan kapcsolódik az úgy nevezett nyílt tokenosztályokba tartozó egyes tokenek felismerése. Ezek olyan tokenek, amelyekben speciális (írásjelek vagy szóközök vannak. Az előfeldolgozás része a tulajdonnevek felismerése is, hiszen itt nagyméretű, tulajdonneveket tartalmazó, szótárakat kell használni A feladatok megoldására kipróbáltunk reguláris kifejezések alapján generált automatát, valamint döntésifa-tanuló algoritmusok által tanult szabályokat.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2003
Volume: 1
Page Range: pp. 38-43
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: 43. p. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 16. 07:56
Last Modified: 2019. Jul. 16. 07:56
URI: http://acta.bibl.u-szeged.hu/id/eprint/59437

Actions (login required)

View Item View Item