Gyenes Viktor; Bontovics Ákos; Lőrincz András: Factored temporal difference learning in the new ties environment. In: Acta cybernetica, (18) 4. pp. 651-668. (2008)
Előnézet |
Cikk, tanulmány, mű
Gyenes_2008_ActaCybernetica.pdf Letöltés (993kB) | Előnézet |
Absztrakt (kivonat)
Although reinforcement learning is a popular method for training an agent for decision making based on rewards, well studied tabular methods are not applicable for large, realistic problems. In this paper, we experiment with a factored version of temporal difference learning, which boils down to a linear function approximation scheme utilising natural features coming from the structure of the task. We conducted experiments in the New Ties environment, which is a novel platform for multi-agent simulations. We show that learning utilising a factored representation is effective even in large state spaces, furthermore it outperforms tabular methods even in smaller problems both in learning speed and stability, because of its generalisation capabilities.
| Mű típusa: | Cikk, tanulmány, mű |
|---|---|
| Befoglaló folyóirat/kiadvány címe: | Acta cybernetica |
| Dátum: | 2008 |
| Kötet: | 18 |
| Szám: | 4 |
| ISSN: | 0324-721X |
| Oldalak: | pp. 651-668 |
| Nyelv: | angol |
| Kiadás helye: | Szeged |
| Konferencia neve: | Symposium of Young Scientists on Intelligent Systems (2.) (2007) (Budapest) |
| Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/38526/ |
| Kulcsszavak: | Számítástechnika, Kibernetika |
| Megjegyzések: | Bibliogr.: p. 667-668. ; összefoglalás angol nyelven |
| Szakterület: | 01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány |
| Feltöltés dátuma: | 2016. okt. 15. 12:25 |
| Utolsó módosítás: | 2022. jún. 16. 14:51 |
| URI: | http://acta.bibl.u-szeged.hu/id/eprint/12840 |
![]() |
Tétel nézet |

