Using the fisher vector approach for cold identification

Egas-López José Vicente; Gosztolya Gábor: Using the fisher vector approach for cold identification. In: Acta cybernetica, (25) 2. pp. 223-232. (2021)

[thumbnail of cybernetica_025_numb_002_223-232.pdf] Cikk, tanulmány, mű
cybernetica_025_numb_002_223-232.pdf

Letöltés (222kB)

Absztrakt (kivonat)

In this paper, we present a computational paralinguistic method for assessing whether a person has an upper respiratory tract infection (i.e. cold) using their speech. Having a system that can accurately assess a cold can be helpful for predicting its propagation. For this purpose, we utilize Mel-frequency Cepstral Coefficients (MFCC) as audio-signal representations, extracted from the utterances, which allowed us to fit a generative Gaussian Mixture Model (GMM) that serves to produce an encoding based on the Fisher Vector (FV) approach. Here, we use the URTIC dataset provided by the organizers of the ComParE Challenge 2017 of the Interspeech Conference. The classification is done by a linear kernel Support Vector Machines (SVM); owing to the high imbalance of classes on the training dataset, we opt for undersampling the majority class, that is, to reduce the number of samples to those of the minority class. We find that applying Power Normalization (PN) and Principal Component Analysis (PCA) on the Fisher vector features is an effective strategy for the classification performance. We get better performance than that of the Bag-of-Audio-Words approach reported in the paper of the challenge.

Mű típusa: Cikk, tanulmány, mű
Befoglaló folyóirat/kiadvány címe: Acta cybernetica
Dátum: 2021
Kötet: 25
Szám: 2
ISSN: 0324-721X
Oldalak: pp. 223-232
Nyelv: angol
Kiadó: University of Szeged, Institute of Informatics
Kiadás helye: Szeged
Konferencia neve: Conference of PhD Students in Computer Science (12.) (2020) (Szeged)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/75565/
DOI: 10.14232/actacyb.287868
Kulcsszavak: Paralingvisztika - számítógépes, Programozás
Megjegyzések: Bibliogr.: p. 230-232. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma: 2022. máj. 12. 14:27
Utolsó módosítás: 2022. máj. 12. 14:27
URI: http://acta.bibl.u-szeged.hu/id/eprint/75607
Bővebben:
Tétel nézet Tétel nézet