Az origo automatikus címkézési projekt tapasztalatai

Farkas, Richárd: Az origo automatikus címkézési projekt tapasztalatai. Magyar Számítógépes Nyelvészeti Konferencia, (4). pp. 84-92. (2009)

[img] Cikk, tanulmány, mű
msznykonf_006_084-092.pdf

Download (98kB)

Abstract

A cikkben bemutatjuk az [origo] hírportál archívumának automatikus címkézésére irányuló projektet. Címkézés alatt azt az eljárását értjük, ami az egyes dokumentumokhoz egy olyan kifejezéshalmazt rendel, amely annak tartalmát jól reprezentálja. A cikkben bemutatásra kerülnek az újságarchívumok címkézésére vonatkozó irányelvek, az automatikus címkézési megoldásunk, az elért eredmények és tárgyalunk olyan nyitott számítógépes nyelvészeti problémákat, amelyek megoldása nagyban hozzájárulhat a címkézés sikerességéhez. Az [origo] archívumának automatikus címkézése manuális kiértékelés alapján a dokumentumok 77,5 százalékát megfelelnek minsítette, ami meghaladta az eredeti célkitűzéseket.

Item Type: Article
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (6.) (2009) (Szeged)
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2009
Volume: 4
Page Range: pp. 84-92
ISBN: 978-963-482-982-9
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 91-92. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 19. 10:22
Last Modified: 2019. Jun. 19. 10:22
URI: http://acta.bibl.u-szeged.hu/id/eprint/58699

Actions (login required)

View Item View Item