Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál

Tikk Domonkos; Törcsvári Attila; Biró György; Bánsághi Zoltán: Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál.

[thumbnail of msznykonf_003_430-434.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_003_430-434.pdf

Letöltés (182kB) | Előnézet

Absztrakt (kivonat)

Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező és a szótár mérete között. Másrészt az egyik szövegbányászati alapfeladat, az osztályozás esetén azt tanulmányozzuk, hogy az egyes szótövezők alkalmazása milyen minőségi következménnyel jár. A vizsgálat során a HunStem szótövezőt, a szópárlista alapú szótövezőt, és egy általunk javasolt ún. óvatos szótövező eljárást hasonlítunk össze. Tesztjeink során a HITEC automatikus osztályozó programcsomagot használtuk.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2005
Kötet: 3
Oldalak: pp. 430-434
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58544/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr. a lábjegyzetben ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. jún. 17. 07:58
Utolsó módosítás: 2022. nov. 08. 11:51
URI: http://acta.bibl.u-szeged.hu/id/eprint/58603
Bővebben:
Tétel nézet Tétel nézet