Az origo automatikus címkézési projekt tapasztalatai

Farkas Richárd: Az origo automatikus címkézési projekt tapasztalatai.

[thumbnail of msznykonf_006_084-092.pdf]
Preview
Cikk, tanulmány, mű
msznykonf_006_084-092.pdf

Download (98kB) | Preview

Abstract

A cikkben bemutatjuk az [origo] hírportál archívumának automatikus címkézésére irányuló projektet. Címkézés alatt azt az eljárását értjük, ami az egyes dokumentumokhoz egy olyan kifejezéshalmazt rendel, amely annak tartalmát jól reprezentálja. A cikkben bemutatásra kerülnek az újságarchívumok címkézésére vonatkozó irányelvek, az automatikus címkézési megoldásunk, az elért eredmények és tárgyalunk olyan nyitott számítógépes nyelvészeti problémákat, amelyek megoldása nagyban hozzájárulhat a címkézés sikerességéhez. Az [origo] archívumának automatikus címkézése manuális kiértékelés alapján a dokumentumok 77,5 százalékát megfelelnek minsítette, ami meghaladta az eredeti célkitűzéseket.

Item Type: Conference or Workshop Item
Journal or Publication Title: Magyar Számítógépes Nyelvészeti Konferencia
Date: 2009
Volume: 6
ISBN: 978-963-482-982-9
Page Range: pp. 84-92
Event Title: Magyar Számítógépes Nyelvészeti Konferencia (6.) (2009) (Szeged)
Related URLs: http://acta.bibl.u-szeged.hu/58547/
Uncontrolled Keywords: Nyelvészet - számítógép alkalmazása
Additional Information: Bibliogr.: p. 91-92. ; összefoglalás magyar nyelven
Date Deposited: 2019. Jun. 19. 10:22
Last Modified: 2022. Nov. 08. 11:50
URI: http://acta.bibl.u-szeged.hu/id/eprint/58699

Actions (login required)

View Item View Item