Farkas Richárd; Szarvas György: Statistical named entity recognition for Hungarian.
Előnézet |
Cikk, tanulmány, mű
msznykonf_002_346.pdf Letöltés (187kB) | Előnézet |
Absztrakt (kivonat)
In this paper, we present decision tree based statistical Named Entity recognizer system for Hungarian. The model was trained and tested on a segment of the Szeged Corpus, containing short business news articles, collected from MTI (Hungarian News Agency, www.mti.hul. We applied C4.5 for classificaton, and examined the accuracy of the system using training sets of different sizes. For this task we used only numerically encodable information (we excluded the word form itself), which contained some orthographical rules specific to Hungarian, but we trained for the recognition of foreign language proper nouns appearing frequently in business news as well. During the experiments the best results showed an accuracy of 89.6% F measure.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2004 |
Kötet: | 2 |
Oldalak: | p. 346 |
Konferencia neve: | Magyar Számítógépes Nyelvészeti Konferencia (2.) (2004) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/59177/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása - előadáskivonat |
Feltöltés dátuma: | 2019. júl. 16. 11:19 |
Utolsó módosítás: | 2022. nov. 08. 11:51 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/59278 |
![]() |
Tétel nézet |