|
|
ホリグチ マサユキ
Horiguchi Masayuki 堀口 正之 所属 神奈川大学 理学部 理学科 神奈川大学大学院 理学研究科 理学専攻(数学領域) 職種 教授 |
|
言語種別 | 日本語 |
発行・発表の年月 | 2007/06 |
形態種別 | 大学・研究所等紀要 |
標題 | マルコフ決定過程におけるTD法による学習アルゴリズムについて(A learning algorithm of TD method for Markov decision processes) |
執筆形態 | 共著 |
掲載誌名 | 京都大学数理解析研究所講究録1559「最適化問題における確率モデルの展開と応用」 |
掲載区分 | 国内 |
巻・号・頁 | 34-49頁 |
著者・共著者 | M. Horiguchi, M. Yasuda and M. Kurano |
概要 | マルコフ決定過程における時間差分法による学習の研究。 |