Az origo automatikus címkézési projekt tapasztalatai

Farkas Richárd: Az origo automatikus címkézési projekt tapasztalatai.

[thumbnail of msznykonf_006_084-092.pdf]
Előnézet
Cikk, tanulmány, mű
msznykonf_006_084-092.pdf

Letöltés (98kB) | Előnézet

Absztrakt (kivonat)

A cikkben bemutatjuk az [origo] hírportál archívumának automatikus címkézésére irányuló projektet. Címkézés alatt azt az eljárását értjük, ami az egyes dokumentumokhoz egy olyan kifejezéshalmazt rendel, amely annak tartalmát jól reprezentálja. A cikkben bemutatásra kerülnek az újságarchívumok címkézésére vonatkozó irányelvek, az automatikus címkézési megoldásunk, az elért eredmények és tárgyalunk olyan nyitott számítógépes nyelvészeti problémákat, amelyek megoldása nagyban hozzájárulhat a címkézés sikerességéhez. Az [origo] archívumának automatikus címkézése manuális kiértékelés alapján a dokumentumok 77,5 százalékát megfelelnek minsítette, ami meghaladta az eredeti célkitűzéseket.

Mű típusa: Konferencia vagy workshop anyag
Befoglaló folyóirat/kiadvány címe: Magyar Számítógépes Nyelvészeti Konferencia
Dátum: 2009
Kötet: 6
ISBN: 978-963-482-982-9
Oldalak: pp. 84-92
Konferencia neve: Magyar Számítógépes Nyelvészeti Konferencia (6.) (2009) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/58547/
Kulcsszavak: Nyelvészet - számítógép alkalmazása
Megjegyzések: Bibliogr.: p. 91-92. ; összefoglalás magyar nyelven
Feltöltés dátuma: 2019. jún. 19. 10:22
Utolsó módosítás: 2022. nov. 08. 11:50
URI: http://acta.bibl.u-szeged.hu/id/eprint/58699
Bővebben:
Tétel nézet Tétel nézet