Vetráb Mercedes; Gosztolya Gábor: Az akusztikus szózsák eljárás korpuszfüggetlenségének vizsgálata.
Előnézet |
Cikk, tanulmány, mű
msznykonf_016_219-231.pdf Letöltés (562kB) | Előnézet |
Absztrakt (kivonat)
Cikkünkben egy jellemzőreprezentációs módszer, az akusztikus szózsák (Bag of Audio Words, BoAW) metódus szélesebb körű használhatóságát elemezzük. A BoAW eljárás lehetővé teszi a változó hosszúságú hangminták fix méretű jellemzővektorokként való kezelését. Ezáltal a különböző hangadatbázisok kezelhetővé és taníthatóvá válnak a hagyományos tanulóalgoritmusokkal is. A BoAW eljárás kezdeti lépésében klaszterközéppontokat (ún. kódszavakat) határozunk meg a keretszintű jellemzővektorok fölött valamilyen felügyelet nélküli módszerrel (pl. kmeans klaszterezéssel, vagy akár csak véletlenszerű kiválasztással). Ezt a lépést hagyományosan az adott akusztikus adatbázis tanító halmazán szokás elvégezni. Ez azonban amellett, hogy minden adatbázison új kódszavak kiválasztását teszi szükségessé, így megnyújtva a jellemzőreprezentációk előállításának idejét, akár túlillesztést is okozhat. Jelen tanulmányunkban megvizsgáljuk, hogy mennyire korpuszfüggő az előálló kódszóhalmaz. Kísérleteinkben egy magyar nyelvű érzelemadatbázison mérünk osztályozási eredményeket, miközben a kódszavak kiválasztása vagy egy német nyelvű érzelemadatbázison, vagy egy magyar nyelvű, általános beszédadatbázison történik. Eredményeink szerint mindkét új típusú megközelítéssel elérhető, a korábban említett hagyományos megközelítéssel elérhető osztályozási pontosság, ami megkönnyítheti a BoAW eljárás gyakorlati alkalmazását.
| Mű típusa: | Konferencia vagy workshop anyag |
|---|---|
| Rovatcím: | Beszédtechnológia II. |
| Befoglaló folyóirat/kiadvány címe: | Magyar Számítógépes Nyelvészeti Konferencia |
| Dátum: | 2020 |
| Kötet: | 16 |
| ISBN: | 978-963-306-719-2 |
| Oldalak: | pp. 219-231 |
| Konferencia neve: | Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) |
| Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/67637/ |
| Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
| Megjegyzések: | Bibliogr.: p. 230-231. ; összefoglalás magyar nyelven |
| Feltöltés dátuma: | 2020. máj. 05. 09:38 |
| Utolsó módosítás: | 2022. nov. 08. 11:49 |
| URI: | http://acta.bibl.u-szeged.hu/id/eprint/67668 |
![]() |
Tétel nézet |

