Magyar szövegek természetes nyelvi előfeldolgozása

Miháczi András and Németh László and Rácz Miklós: Magyar szövegek természetes nyelvi előfeldolgozása.

[thumbnail of msznykonf_001_038-043.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_001_038-043.pdf

Download (476kB) | Preview

Abstract

A természetes nyelvi szövegek előfeldolgozásának feladata a szöveg mondatokra, szavakra bontása, tokenizálása (tokennek nevezzük a legkisebb önálló jelentéssel biró szövegegységet). Ehhez szorosan kapcsolódik az úgy nevezett nyílt tokenosztályokba tartozó egyes tokenek felismerése. Ezek olyan tokenek, amelyekben speciális (írásjelek vagy szóközök vannak. Az előfeldolgozás része a tulajdonnevek felismerése is, hiszen itt nagyméretű, tulajdonneveket tartalmazó, szótárakat kell használni A feladatok megoldására kipróbáltunk reguláris kifejezések alapján generált automatát, valamint döntésifa-tanuló algoritmusok által tanult szabályokat.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2003
Volume: 1
Page Range: pp. 38-43
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/59176/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: 43. p. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jul. 16. 07:56
Last Modified: 2022. Nov. 08. 11:51
URI: http://acta.bibl.u-szeged.hu/id/eprint/59437

Actions (login required)

View Item View Item