TY  - CONF
ID  - acta58744
A1  -  Váradi Tamás
A1  -  Pintér Tibor
A1  -  Mittelholcz Iván
A1  -  Peredy Márta
T2  - Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged)
N1  - Bibliogr.: p. 64-65. ; összefoglalás magyar nyelven
Y1  - 2010///
TI  - Bibliográfiai hivatkozások automatikus kinyerése
SP  - 56
EP  - 65
AV  - public
KW  - Nyelvészet - számítógép alkalmazása
VL  - 7
SN  - 978-963-306-075-9
UR  - http://acta.bibl.u-szeged.hu/58744/
N2  - A Magyarországon megjelentetett társadalomtudományi folyóiratok tanulmányaiból automatikusan kigyjtött hivatkozások adatbázisba rendezése jelents segítség a tudomány számára. A heterogén források által többféle struktúrában megjelenített adatok elemzését és azonos formátumba rendezését a szabad felhasználású NooJ szoftver segítségével végeztük. A folyamat valódi kihívása az adathalmaz elemeinek, valamint a hivatkozások típusának automatikus felismerésében rejlik. A külön-külön létrehozott (ugyanakkor egymással kombinálható) NooJ-grammatikák szerepe a hivatkozások egyes elemeinek felismerése és annotálása. Az automatizált folyamat kimeneteként létrejöv XMLelemek még utólagos kézimunkára szorulnak, részint a hivatkozások rossz minsége miatt (hiányos hivatkozások, szabványoktól eltér hivatkozások), részint a folyamat formalizált volta miatt (bizonyos hivatkozások automatikusan több hivatkozástípusba is besorolódnak). A BibTex-szabványosítás eltt egyértelmsít algoritmusokat és/vagy kézi ert kell használni.
ER  -