Tikk Domonkos; Törcsvári Attila; Biró György; Bánsághi Zoltán: Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál.
Előnézet |
Cikk, tanulmány, mű
msznykonf_003_430-434.pdf Letöltés (182kB) | Előnézet |
Absztrakt (kivonat)
Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező és a szótár mérete között. Másrészt az egyik szövegbányászati alapfeladat, az osztályozás esetén azt tanulmányozzuk, hogy az egyes szótövezők alkalmazása milyen minőségi következménnyel jár. A vizsgálat során a HunStem szótövezőt, a szópárlista alapú szótövezőt, és egy általunk javasolt ún. óvatos szótövező eljárást hasonlítunk össze. Tesztjeink során a HITEC automatikus osztályozó programcsomagot használtuk.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2005 |
Kötet: | 3 |
Oldalak: | pp. 430-434 |
Konferencia neve: | Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/58544/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr. a lábjegyzetben ; összefoglalás magyar nyelven |
Feltöltés dátuma: | 2019. jún. 17. 07:58 |
Utolsó módosítás: | 2022. nov. 08. 11:51 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58603 |
Tétel nézet |