%0 Conference Paper %A Novák Attila %A Nagy Viktor %A Oravecz Csaba %B Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged) %D 2003 %F acta:59435 %K Nyelvészet - számítógép alkalmazása %P 45-54 %T Magyar ismeretlen szó-elemző program fejlesztése %U http://acta.bibl.u-szeged.hu/59435/ %V 1 %X Nagy korpuszok szám ítógépes feldolgozása során elkerülhetetlenül beleütközünk abba a problém ába, hogy a szövegekben szereplő szóalakok igen jelentős részét nem tu dja a rendelkezésre álló morfológiai elemzőprogram elemezni, mert hiányzik az adatbázisából a szó töve. Ugyanakkor ezeknek az elem ezhetetlen szóalakoknak a nagy része tartalmaz toldalékokat, ezért valamilyen módon ezeket is elemezni kell. Ennek a problém ának a kezelésére olyan hibrid eljárást lehet alkalmazni, amely szimbolikus parciális morfológiai elemzőből és egy olyan statisztikai alapú eszközből áll, amely az első lépésben a szimbolikus ismeretlenszó-elemző által előállított hipotézisteret a kívánt mértékűre szűkíti. %Z Bibliogr.: p. 53-54. ; összefoglalás magyar nyelven