Tóth Krisztina; Farkas Richárd; Kocsor András: Sentence alignment of Hungarian-English parallel corpora using a hybrid algorithm. In: Acta cybernetica, (18) 3. pp. 463-478. (2008)
Előnézet |
Cikk, tanulmány, mű
Toth_2008_ActaCybernetica.pdf Letöltés (199kB) | Előnézet |
Absztrakt (kivonat)
We present an efficient hybrid method for aligning sentences with their translations in a parallel bilingual corpus. The new algorithm is composed of a length-based and anchor matching method that uses Named Entity recognition. This algorithm combines the speed of length-based models with the accuracy of anchor finding methods. The accuracy of finding cognates for Hungarian-English language pair is extremely low, hence we thought of using a novel approach that includes Named Entity recognition. Due to the well selected anchors it was found to outperform the best two sentence alignment algorithms so far published for the Hungarian-English language pair.
| Mű típusa: | Cikk, tanulmány, mű |
|---|---|
| Befoglaló folyóirat/kiadvány címe: | Acta cybernetica |
| Dátum: | 2008 |
| Kötet: | 18 |
| Szám: | 3 |
| ISSN: | 0324-721X |
| Oldalak: | pp. 463-478 |
| Nyelv: | angol |
| Kiadás helye: | Szeged |
| Konferencia neve: | Conference for PhD Students in Computer Science (5.) (2006) (Szeged) |
| Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/38525/ |
| Kulcsszavak: | Számítástechnika, Kibernetika, Algoritmus |
| Megjegyzések: | Bibliogr.: p. 476-477. ; összefoglalás angol nyelven |
| Szakterület: | 01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány |
| Feltöltés dátuma: | 2016. okt. 15. 12:25 |
| Utolsó módosítás: | 2022. jún. 16. 15:53 |
| URI: | http://acta.bibl.u-szeged.hu/id/eprint/12830 |
![]() |
Tétel nézet |

