Magyar szövegek természetes nyelvi előfeldolgozása

Miháczi András; Németh László; Rácz Miklós: Magyar szövegek természetes nyelvi előfeldolgozása.

[thumbnail of msznykonf_001_038-043.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_001_038-043.pdf

Letöltés (476kB) | Előnézet

Absztrakt (kivonat)

A természetes nyelvi szövegek előfeldolgozásának feladata a szöveg mondatokra, szavakra bontása, tokenizálása (tokennek nevezzük a legkisebb önálló jelentéssel biró szövegegységet). Ehhez szorosan kapcsolódik az úgy nevezett nyílt tokenosztályokba tartozó egyes tokenek felismerése. Ezek olyan tokenek, amelyekben speciális (írásjelek vagy szóközök vannak. Az előfeldolgozás része a tulajdonnevek felismerése is, hiszen itt nagyméretű, tulajdonneveket tartalmazó, szótárakat kell használni A feladatok megoldására kipróbáltunk reguláris kifejezések alapján generált automatát, valamint döntésifa-tanuló algoritmusok által tanult szabályokat.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2003
Kötet: 1
Oldalak: pp. 38-43
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/59176/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: 43. p. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. júl. 16. 07:56
Utolsó módosítás: 2022. nov. 08. 11:51
URI: http://acta.bibl.u-szeged.hu/id/eprint/59437
Bővebben:
Tétel nézet Tétel nézet