TY - CONF ID - acta58744 A1 - Váradi Tamás A1 - Pintér Tibor A1 - Mittelholcz Iván A1 - Peredy Márta T2 - Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged) N1 - Bibliogr.: p. 64-65. ; összefoglalás magyar nyelven Y1 - 2010/// TI - Bibliográfiai hivatkozások automatikus kinyerése SP - 56 EP - 65 AV - public KW - Nyelvészet - számítógép alkalmazása VL - 7 SN - 978-963-306-075-9 UR - http://acta.bibl.u-szeged.hu/58744/ N2 - A Magyarországon megjelentetett társadalomtudományi folyóiratok tanulmányaiból automatikusan kigyjtött hivatkozások adatbázisba rendezése jelents segítség a tudomány számára. A heterogén források által többféle struktúrában megjelenített adatok elemzését és azonos formátumba rendezését a szabad felhasználású NooJ szoftver segítségével végeztük. A folyamat valódi kihívása az adathalmaz elemeinek, valamint a hivatkozások típusának automatikus felismerésében rejlik. A külön-külön létrehozott (ugyanakkor egymással kombinálható) NooJ-grammatikák szerepe a hivatkozások egyes elemeinek felismerése és annotálása. Az automatizált folyamat kimeneteként létrejöv XMLelemek még utólagos kézimunkára szorulnak, részint a hivatkozások rossz minsége miatt (hiányos hivatkozások, szabványoktól eltér hivatkozások), részint a folyamat formalizált volta miatt (bizonyos hivatkozások automatikusan több hivatkozástípusba is besorolódnak). A BibTex-szabványosítás eltt egyértelmsít algoritmusokat és/vagy kézi ert kell használni. ER -