Sentence alignment of Hungarian-English parallel corpora using a hybrid algorithm

Tóth Krisztina; Farkas Richárd; Kocsor András: Sentence alignment of Hungarian-English parallel corpora using a hybrid algorithm. In: Acta cybernetica, (18) 3. pp. 463-478. (2008)

[thumbnail of Toth_2008_ActaCybernetica.pdf]
Előnézet
Cikk, tanulmány, mű
Toth_2008_ActaCybernetica.pdf

Letöltés (199kB) | Előnézet

Absztrakt (kivonat)

We present an efficient hybrid method for aligning sentences with their translations in a parallel bilingual corpus. The new algorithm is composed of a length-based and anchor matching method that uses Named Entity recognition. This algorithm combines the speed of length-based models with the accuracy of anchor finding methods. The accuracy of finding cognates for Hungarian-English language pair is extremely low, hence we thought of using a novel approach that includes Named Entity recognition. Due to the well selected anchors it was found to outperform the best two sentence alignment algorithms so far published for the Hungarian-English language pair.

Mű típusa: Cikk, tanulmány, mű
Befoglaló folyóirat/kiadvány címe: Acta cybernetica
Dátum: 2008
Kötet: 18
Szám: 3
ISSN: 0324-721X
Oldalak: pp. 463-478
Nyelv: angol
Kiadás helye: Szeged
Konferencia neve: Conference for PhD Students in Computer Science (5.) (2006) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/38525/
Kulcsszavak: Számítástechnika, Kibernetika, Algoritmus
Megjegyzések: Bibliogr.: p. 476-477. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma: 2016. okt. 15. 12:25
Utolsó módosítás: 2022. jún. 16. 15:53
URI: http://acta.bibl.u-szeged.hu/id/eprint/12830
Bővebben:
Tétel nézet Tétel nézet