Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál

Tikk, Domonkos and Törcsvári, Attila and Biró, György and Bánsághi, Zoltán: Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál. Magyar Számítógépes Nyelvészeti Konferencia, (1). pp. 430-434. (2005)

[img] Cikk, tanulmány, mű
msznykonf_003_430-434.pdf

Download (182kB)

Abstract

Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező és a szótár mérete között. Másrészt az egyik szövegbányászati alapfeladat, az osztályozás esetén azt tanulmányozzuk, hogy az egyes szótövezők alkalmazása milyen minőségi következménnyel jár. A vizsgálat során a HunStem szótövezőt, a szópárlista alapú szótövezőt, és egy általunk javasolt ún. óvatos szótövező eljárást hasonlítunk össze. Tesztjeink során a HITEC automatikus osztályozó programcsomagot használtuk.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2005
Volume: 1
Page Range: pp. 430-434
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr. a lábjegyzetben ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 17. 07:58
Last Modified: 2019. Jun. 17. 07:58
URI: http://acta.bibl.u-szeged.hu/id/eprint/58603

Actions (login required)

View Item View Item