Többszavas kifejezések kezelése a párhuzamos korpuszokra épülő szótárkészítési módszertanban

Héja, Enikő and Sass, Bálint: Többszavas kifejezések kezelése a párhuzamos korpuszokra épülő szótárkészítési módszertanban. Magyar Számítógépes Nyelvészeti Konferencia, (5). pp. 80-90. (2010)

[img] Cikk, tanulmány, mű
msznykonf_007_080-090.pdf

Download (100kB)

Abstract

Jelen cikk célja annak vizsgálata, hogy a párhuzamos korpuszokból fordítási ekvivalensek kinyerésére használt módszer kiterjeszthet-e többszavas kifejezésekre is. A kísérletben a többszavas kifejezéseket kizárólag igei szerkezetek alkották. Els lépésként a párhuzamos korpusz forrásnyelvi és célnyelvi oldalából külön-külön nyertük ki az igei szerkezeteket. A jelenlegi fázisban a kinyerés félig automatikus módon történt: elre meghatározott forrásnyelvi igékhez és ezek célnyelvi fordításaihoz tartozó igei szerkezeteket kerestünk, melyekbl kézzel válogattuk ki a céljainknak megfeleleket. A következ lépésben ezeket egytagú kifejezésekké vontuk össze a párhuzamos korpuszban. Az összevont igei szerkezetek már az illesztési algoritmus bemeneteként szolgálhattak. Eredményeink azt mutatják, hogy az alkalmazott módszer jól használható igei szerkezetek fordítási ekvivalenseinek detekciójára.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2010
Volume: 5
Page Range: pp. 80-90
ISBN: 978-963-306-075-9
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 89-90. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 20. 11:08
Last Modified: 2019. Jun. 20. 11:08
URI: http://acta.bibl.u-szeged.hu/id/eprint/58746

Actions (login required)

View Item View Item