Sztahó Dávid; Beke András; Szaszák György; Fejes Attila: Forensic authorship classification by paragraph vectors of speech transcriptions.
Cikk, tanulmány, mű
msznykonf_018_271-279.pdf Letöltés (458kB) |
Absztrakt (kivonat)
In forensic comparison, document classification techniques are used mainly for authorship classification and author profiling. In the present study, we aim to introduce paragraph vector modelling (by Doc2Vec) into the likelihoodratio framework paradigm of forensic evidence comparison. Transcriptions of spontaneous speech recording are used as input to paragraph vector extraction model training. Logistic regression models are trained based on cosine distances of paragraph vector pairs to predict the same and different author origin probability. Results are evaluated according to different speaking styles (transcriptions of speech tasks available in the dataset). Cllr and equal error rate values (lowest ones are 0.47 and 0.11, respectively) show that the method can be useful as a feature for forensic authorship comparison and may extend the voice comparison methods for speaker verification.
Mű típusa: | Konferencia vagy workshop anyag |
---|---|
Rovatcím: | Alkalmazások |
Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
Dátum: | 2022 |
Kötet: | 18 |
ISBN: | 978-963-306-848-9 |
Oldalak: | pp. 271-279 |
Nyelv: | angol |
Kiadás helye: | Szeged |
Konferencia neve: | Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged) |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/75797/ |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Megjegyzések: | Bibliogr.: 279. p. ; ill. ; összefoglalás angol nyelven |
Szakterület: | 01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány 06. Bölcsészettudományok 06. Bölcsészettudományok > 06.02. Nyelvek és irodalom |
Feltöltés dátuma: | 2022. máj. 25. 10:30 |
Utolsó módosítás: | 2022. nov. 08. 11:49 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/75880 |
Tétel nézet |