%0 Conference Paper %A Váradi Tamás %A Pintér Tibor %A Mittelholcz Iván %A Peredy Márta %B Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged) %D 2010 %F acta:58744 %K Nyelvészet - számítógép alkalmazása %P 56-65 %T Bibliográfiai hivatkozások automatikus kinyerése %U http://acta.bibl.u-szeged.hu/58744/ %V 7 %X A Magyarországon megjelentetett társadalomtudományi folyóiratok tanulmányaiból automatikusan kigyjtött hivatkozások adatbázisba rendezése jelents segítség a tudomány számára. A heterogén források által többféle struktúrában megjelenített adatok elemzését és azonos formátumba rendezését a szabad felhasználású NooJ szoftver segítségével végeztük. A folyamat valódi kihívása az adathalmaz elemeinek, valamint a hivatkozások típusának automatikus felismerésében rejlik. A külön-külön létrehozott (ugyanakkor egymással kombinálható) NooJ-grammatikák szerepe a hivatkozások egyes elemeinek felismerése és annotálása. Az automatizált folyamat kimeneteként létrejöv XMLelemek még utólagos kézimunkára szorulnak, részint a hivatkozások rossz minsége miatt (hiányos hivatkozások, szabványoktól eltér hivatkozások), részint a folyamat formalizált volta miatt (bizonyos hivatkozások automatikusan több hivatkozástípusba is besorolódnak). A BibTex-szabványosítás eltt egyértelmsít algoritmusokat és/vagy kézi ert kell használni. %Z Bibliogr.: p. 64-65. ; összefoglalás magyar nyelven