Novák Attila: "Olcsó" morfológia.
Előnézet |
Cikk, tanulmány, mű
msznykonf_011_145-157.pdf Letöltés (250kB) | Előnézet |
Absztrakt (kivonat)
A számítógépes morfológiai leírások egy része a lexikon mellett szabálykomponenst is tartalmaz. Ez utóbbi biztosítja egyrészt a morfológiai leírás konzisztenciáját, másrészt megkönnyíti a morfológia új lexikai elemekkel való bővítését. Azonban egy ilyen típusú leírás elkészítése komoly erőfeszítést és különféle kompetenciákat igényel. A legtöbb szabadon elérhető morfológiai leírás viszont nem tartalmaz szabályokat. Ezek általában egy alaktani szótáron alapulnak, és a szavak lemmája és esetleg ettől eltérő töve mellett valamilyen a szó ragozási paradigmáját leíró információt tartalmaznak, gyakran valamiféle paradigmaazonosító címke formájában. Ezt esetleg még egyéb lexikai–szintaktikai–szemantikai információ egészítheti ki. Az ebben a cikkben bemutatott kutatás célja egy olyan algoritmus kidolgozása volt, amely lehetővé teszi, hogy a szabályalapú morfológiákhoz hasonlóan egyszerű módon lehessen az ilyen szótáralapú morfológiai leírásokba is új lexikai tételeket felvenni. A felügyelt tanításon alapuló algoritmus a szótárból hiányzó szavak helyes ragozási paradigmáját próbálja meg megjósolni a leghosszabb illeszkedő végződések és lexikai gyakorisági adatok felhasználásával. Az algoritmust orosz nyelvű adatokon mutatjuk be és értékeljük ki.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2015 |
Kötet: | 11 |
ISBN: | 978-963-306-359-0 |
Oldalak: | pp. 145-157 |
Konferencia neve: | Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/58552/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr.: p. 156-157. ; összefoglalás magyar nyelven |
Feltöltés dátuma: | 2019. jún. 28. 09:54 |
Utolsó módosítás: | 2022. nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58928 |
![]() |
Tétel nézet |