Szepesvári Csaba: Non-Markovian policies in sequential decision problems. In: Acta cybernetica, (13) 3. pp. 305-318. (1998)
Előnézet |
Cikk, tanulmány, mű
cybernetica_013_numb_003_305-318.pdf Letöltés (1MB) | Előnézet |
Absztrakt (kivonat)
In this article we prove the validity of the Bellman Optimality Equation and related results for sequential decision problems with a general recursive structure. The characteristic feature of our approach is that also nonMarkovian policies are taken into account. The theory is motivated by some experiments with a learning robot.
Mű típusa: | Cikk, tanulmány, mű |
---|---|
Befoglaló folyóirat/kiadvány címe: | Acta cybernetica |
Dátum: | 1998 |
Kötet: | 13 |
Szám: | 3 |
ISSN: | 0324-721X |
Oldalak: | pp. 305-318 |
Nyelv: | angol |
Kiadás helye: | Szeged |
Befoglaló mű URL: | http://acta.bibl.u-szeged.hu/38505/ |
Kulcsszavak: | Számítástechnika, Kibernetika |
Megjegyzések: | Bibliogr.: p. 317-318. ; összefoglalás angol nyelven |
Szakterület: | 01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány |
Feltöltés dátuma: | 2016. okt. 15. 12:26 |
Utolsó módosítás: | 2022. jún. 13. 15:56 |
URI: | http://acta.bibl.u-szeged.hu/id/eprint/12592 |
![]() |
Tétel nézet |