Non-Markovian policies in sequential decision problems

Szepesvári Csaba: Non-Markovian policies in sequential decision problems. In: Acta cybernetica, (13) 3. pp. 305-318. (1998)

[thumbnail of cybernetica_013_numb_003_305-318.pdf]

Előnézet

Cikk, tanulmány, mű
cybernetica_013_numb_003_305-318.pdf
Letöltés (1MB) | Előnézet

Absztrakt (kivonat)

In this article we prove the validity of the Bellman Optimality Equation and related results for sequential decision problems with a general recursive structure. The characteristic feature of our approach is that also nonMarkovian policies are taken into account. The theory is motivated by some experiments with a learning robot.

Mű típusa:	Cikk, tanulmány, mű
Befoglaló folyóirat/kiadvány címe:	Acta cybernetica
Dátum:	1998
Kötet:	13
Szám:	3
ISSN:	0324-721X
Oldalak:	pp. 305-318
Nyelv:	angol
Kiadás helye:	Szeged
Befoglaló mű URL:	http://acta.bibl.u-szeged.hu/38505/
Kulcsszavak:	Számítástechnika, Kibernetika
Megjegyzések:	Bibliogr.: p. 317-318. ; összefoglalás angol nyelven
Szakterület:	01. Természettudományok 01. Természettudományok > 01.02. Számítás- és információtudomány
Feltöltés dátuma:	2016. okt. 15. 12:26
Utolsó módosítás:	2022. jún. 13. 15:56
URI:	http://acta.bibl.u-szeged.hu/id/eprint/12592

Bővebben:

Tétel nézet