Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál

Tikk Domonkos and Törcsvári Attila and Biró György and Bánsághi Zoltán: Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál.

[thumbnail of msznykonf_003_430-434.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_003_430-434.pdf

Download (182kB) | Preview

Abstract

Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező és a szótár mérete között. Másrészt az egyik szövegbányászati alapfeladat, az osztályozás esetén azt tanulmányozzuk, hogy az egyes szótövezők alkalmazása milyen minőségi következménnyel jár. A vizsgálat során a HunStem szótövezőt, a szópárlista alapú szótövezőt, és egy általunk javasolt ún. óvatos szótövező eljárást hasonlítunk össze. Tesztjeink során a HITEC automatikus osztályozó programcsomagot használtuk.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2005
Volume: 3
Page Range: pp. 430-434
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/58544/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr. a lábjegyzetben ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 17. 07:58
Last Modified: 2022. Nov. 08. 11:51
URI: http://acta.bibl.u-szeged.hu/id/eprint/58603

Actions (login required)

View Item View Item