Factored temporal difference learning in the new ties environment

Gyenes Viktor; Bontovics Ákos; Lőrincz András: Factored temporal difference learning in the new ties environment. In: Acta cybernetica, (18) 4. pp. 651-668. (2008)

[thumbnail of Gyenes_2008_ActaCybernetica.pdf]
Előnézet
Cikk, tanulmány, mű
Gyenes_2008_ActaCybernetica.pdf

Letöltés (993kB) | Előnézet

Absztrakt (kivonat)

Although reinforcement learning is a popular method for training an agent for decision making based on rewards, well studied tabular methods are not applicable for large, realistic problems. In this paper, we experiment with a factored version of temporal difference learning, which boils down to a linear function approximation scheme utilising natural features coming from the structure of the task. We conducted experiments in the New Ties environment, which is a novel platform for multi-agent simulations. We show that learning utilising a factored representation is effective even in large state spaces, furthermore it outperforms tabular methods even in smaller problems both in learning speed and stability, because of its generalisation capabilities.

Mű típusa: Cikk, tanulmány, mű
Befoglaló folyóirat/kiadvány címe: Acta cybernetica
Dátum: 2008
Kötet: 18
Szám: 4
ISSN: 0324-721X
Oldalak: pp. 651-668
Nyelv: angol
Kiadás helye: Szeged
Konferencia neve: Symposium of Young Scientists on Intelligent Systems (2.) (2007) (Budapest)
Befoglaló mű URL: http://acta.bibl.u-szeged.hu/38526/
Kulcsszavak: Számítástechnika, Kibernetika
Megjegyzések: Bibliogr.: p. 667-668. ; összefoglalás angol nyelven
Szakterület: 01. Természettudományok
01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma: 2016. okt. 15. 12:25
Utolsó módosítás: 2022. jún. 16. 14:51
URI: http://acta.bibl.u-szeged.hu/id/eprint/12840
Bővebben:
Tétel nézet Tétel nézet