"Olcsó" morfológia

Novák, Attila: "Olcsó" morfológia. Magyar Számítógépes Nyelvészeti Konferencia, (9). pp. 145-157. (2015)

[img] Cikk, tanulmány, mű
msznykonf_011_145-157.pdf

Download (250kB)

Abstract

A számítógépes morfológiai leírások egy része a lexikon mellett szabálykomponenst is tartalmaz. Ez utóbbi biztosítja egyrészt a morfológiai leírás konzisztenciáját, másrészt megkönnyíti a morfológia új lexikai elemekkel való bővítését. Azonban egy ilyen típusú leírás elkészítése komoly erőfeszítést és különféle kompetenciákat igényel. A legtöbb szabadon elérhető morfológiai leírás viszont nem tartalmaz szabályokat. Ezek általában egy alaktani szótáron alapulnak, és a szavak lemmája és esetleg ettől eltérő töve mellett valamilyen a szó ragozási paradigmáját leíró információt tartalmaznak, gyakran valamiféle paradigmaazonosító címke formájában. Ezt esetleg még egyéb lexikai–szintaktikai–szemantikai információ egészítheti ki. Az ebben a cikkben bemutatott kutatás célja egy olyan algoritmus kidolgozása volt, amely lehetővé teszi, hogy a szabályalapú morfológiákhoz hasonlóan egyszerű módon lehessen az ilyen szótáralapú morfológiai leírásokba is új lexikai tételeket felvenni. A felügyelt tanításon alapuló algoritmus a szótárból hiányzó szavak helyes ragozási paradigmáját próbálja meg megjósolni a leghosszabb illeszkedő végződések és lexikai gyakorisági adatok felhasználásával. Az algoritmust orosz nyelvű adatokon mutatjuk be és értékeljük ki.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2015
Volume: 9
Page Range: pp. 145-157
ISBN: 978-963-306-359-0
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 156-157. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 28. 09:54
Last Modified: 2019. Jun. 28. 09:54
URI: http://acta.bibl.u-szeged.hu/id/eprint/58928

Actions (login required)

View Item View Item