|
|
ホリグチ マサユキ
Horiguchi Masayuki 堀口 正之 所属 神奈川大学 理学部 理学科 神奈川大学大学院 理学研究科 理学専攻(数学領域) 職種 教授 |
|
言語種別 | 日本語 |
発行・発表の年月 | 2007/12 |
形態種別 | 学術雑誌 |
査読 | 査読あり |
標題 | A learning algorithm for communicating Markov decision processes with unknown transition matrices |
執筆形態 | 共著 |
掲載誌名 | Bulletin of Informatics and Cybernetics |
掲載区分 | 国外 |
巻・号・頁 | 39,11-24頁 |
著者・共著者 | T. Iki, M. Horiguchi, M. Yasuda and M. Kurano |
概要 | 推移状態は観測できるが推移確率法則は未知であるような有限状態かつcommunicating classをもつ多重連鎖マルコフ決定過程についての研究。
「査読付き」 |
DOI | https://doi.org/10.5109/16771 |