Váradi Tamás and Pintér Tibor and Mittelholcz Iván and Peredy Márta: Bibliográfiai hivatkozások automatikus kinyerése.
Preview |
Cikk, tanulmány, mű
msznykonf_007_056-065.pdf Download (106kB) | Preview |
Abstract
A Magyarországon megjelentetett társadalomtudományi folyóiratok tanulmányaiból automatikusan kigyjtött hivatkozások adatbázisba rendezése jelents segítség a tudomány számára. A heterogén források által többféle struktúrában megjelenített adatok elemzését és azonos formátumba rendezését a szabad felhasználású NooJ szoftver segítségével végeztük. A folyamat valódi kihívása az adathalmaz elemeinek, valamint a hivatkozások típusának automatikus felismerésében rejlik. A külön-külön létrehozott (ugyanakkor egymással kombinálható) NooJ-grammatikák szerepe a hivatkozások egyes elemeinek felismerése és annotálása. Az automatizált folyamat kimeneteként létrejöv XMLelemek még utólagos kézimunkára szorulnak, részint a hivatkozások rossz minsége miatt (hiányos hivatkozások, szabványoktól eltér hivatkozások), részint a folyamat formalizált volta miatt (bizonyos hivatkozások automatikusan több hivatkozástípusba is besorolódnak). A BibTex-szabványosítás eltt egyértelmsít algoritmusokat és/vagy kézi ert kell használni.
Item Type: | Conference or Workshop Item |
---|---|
Journal or Publication Title: | Magyar Számítógépes Nyelvészeti Konferencia |
Date: | 2010 |
Volume: | 7 |
ISBN: | 978-963-306-075-9 |
Page Range: | pp. 56-65 |
Event Title: | Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged) |
Related URLs: | http://acta.bibl.u-szeged.hu/58548/ |
Uncontrolled Keywords: | Nyelvészet - számítógép alkalmazása |
Additional Information: | Bibliogr.: p. 64-65. ; összefoglalás magyar nyelven |
Date Deposited: | 2019. Jun. 20. 10:54 |
Last Modified: | 2022. Nov. 08. 11:50 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/58744 |
Actions (login required)
View Item |