Magyar ismeretlen szó-elemző program fejlesztése

Novák Attila; Nagy Viktor; Oravecz Csaba: Magyar ismeretlen szó-elemző program fejlesztése.

[thumbnail of msznykonf_001_045-054.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_001_045-054.pdf

Letöltés (676kB) | Előnézet

Absztrakt (kivonat)

Nagy korpuszok szám ítógépes feldolgozása során elkerülhetetlenül beleütközünk abba a problém ába, hogy a szövegekben szereplő szóalakok igen jelentős részét nem tu dja a rendelkezésre álló morfológiai elemzőprogram elemezni, mert hiányzik az adatbázisából a szó töve. Ugyanakkor ezeknek az elem ezhetetlen szóalakoknak a nagy része tartalmaz toldalékokat, ezért valamilyen módon ezeket is elemezni kell. Ennek a problém ának a kezelésére olyan hibrid eljárást lehet alkalmazni, amely szimbolikus parciális morfológiai elemzőből és egy olyan statisztikai alapú eszközből áll, amely az első lépésben a szimbolikus ismeretlenszó-elemző által előállított hipotézisteret a kívánt mértékűre szűkíti.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2003
Kötet: 1
Oldalak: pp. 45-54
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/59176/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 53-54. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. júl. 15. 13:49
Utolsó módosítás: 2022. nov. 08. 11:51
URI: http://acta.bibl.u-szeged.hu/id/eprint/59435
Bővebben:
Tétel nézet Tétel nézet