%0 Conference Paper
%A  Váradi Tamás
%A  Pintér Tibor
%A  Mittelholcz Iván
%A  Peredy Márta
%B Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged)
%D 2010
%F acta:58744
%K Nyelvészet - számítógép alkalmazása
%P 56-65
%T Bibliográfiai hivatkozások automatikus kinyerése
%U http://acta.bibl.u-szeged.hu/58744/
%V 7
%X A Magyarországon megjelentetett társadalomtudományi folyóiratok tanulmányaiból automatikusan kigyjtött hivatkozások adatbázisba rendezése jelents segítség a tudomány számára. A heterogén források által többféle struktúrában megjelenített adatok elemzését és azonos formátumba rendezését a szabad felhasználású NooJ szoftver segítségével végeztük. A folyamat valódi kihívása az adathalmaz elemeinek, valamint a hivatkozások típusának automatikus felismerésében rejlik. A külön-külön létrehozott (ugyanakkor egymással kombinálható) NooJ-grammatikák szerepe a hivatkozások egyes elemeinek felismerése és annotálása. Az automatizált folyamat kimeneteként létrejöv XMLelemek még utólagos kézimunkára szorulnak, részint a hivatkozások rossz minsége miatt (hiányos hivatkozások, szabványoktól eltér hivatkozások), részint a folyamat formalizált volta miatt (bizonyos hivatkozások automatikusan több hivatkozástípusba is besorolódnak). A BibTex-szabványosítás eltt egyértelmsít algoritmusokat és/vagy kézi ert kell használni.
%Z Bibliogr.: p. 64-65. ; összefoglalás magyar nyelven