Tikk Domonkos and Törcsvári Attila and Biró György and Bánsághi Zoltán: Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál.
Preview |
Cikk, tanulmány, mű
msznykonf_003_430-434.pdf Download (182kB) | Preview |
Abstract
Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező és a szótár mérete között. Másrészt az egyik szövegbányászati alapfeladat, az osztályozás esetén azt tanulmányozzuk, hogy az egyes szótövezők alkalmazása milyen minőségi következménnyel jár. A vizsgálat során a HunStem szótövezőt, a szópárlista alapú szótövezőt, és egy általunk javasolt ún. óvatos szótövező eljárást hasonlítunk össze. Tesztjeink során a HITEC automatikus osztályozó programcsomagot használtuk.
Item Type: | Conference or Workshop Item |
---|---|
Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
Date: | 2005 |
Volume: | 3 |
Page Range: | pp. 430-434 |
Event Title: | Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged) |
Related URLs: | http://acta.bibl.u-szeged.hu/58544/ |
Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása |
Additional Information: | Bibliogr. a lábjegyzetben ; összefoglalás magyar nyelven |
Date Deposited: | 2019. Jun. 17. 07:58 |
Last Modified: | 2022. Nov. 08. 11:51 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58603 |
Actions (login required)
![]() |
View Item |