Magyar szövegek természetes nyelvi előfeldolgozása

Miháczi András; Németh László; Rácz Miklós: Magyar szövegek természetes nyelvi előfeldolgozása.

[thumbnail of msznykonf_001_038-043.pdf]

Előnézet

Cikk, tanulmány, mű
msznykonf_001_038-043.pdf
Letöltés (476kB) | Előnézet

Absztrakt (kivonat)

A természetes nyelvi szövegek előfeldolgozásának feladata a szöveg mondatokra, szavakra bontása, tokenizálása (tokennek nevezzük a legkisebb önálló jelentéssel biró szövegegységet). Ehhez szorosan kapcsolódik az úgy nevezett nyílt tokenosztályokba tartozó egyes tokenek felismerése. Ezek olyan tokenek, amelyekben speciális (írásjelek vagy szóközök vannak. Az előfeldolgozás része a tulajdonnevek felismerése is, hiszen itt nagyméretű, tulajdonneveket tartalmazó, szótárakat kell használni A feladatok megoldására kipróbáltunk reguláris kifejezések alapján generált automatát, valamint döntésifa-tanuló algoritmusok által tanult szabályokat.

Mű típusa:	Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe:	Magyar Számítógépes Nyelvészeti Konferencia
Dátum:	2003
Kötet:	1
Oldalak:	pp. 38-43
Konferencia neve:	Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Befoglaló mű URL:	http://acta.bibl.u-szeged.hu/59176/
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Megjegyzések:	Bibliogr.: 43. p. ; összefoglalás magyar nyelven
Feltöltés dátuma:	2019. júl. 16. 07:56
Utolsó módosítás:	2022. nov. 08. 11:51
URI:	http://acta.bibl.u-szeged.hu/id/eprint/59437

Bővebben:

Tétel nézet