ホリグチ マサユキ   Horiguchi Masayuki
  堀口 正之
   所属   神奈川大学  理学部 数理・物理学科
    神奈川大学大学院  理学研究科 理学専攻(数学領域)
   職種   教授
言語種別 日本語
発行・発表の年月 2007/06
形態種別 大学・研究所等紀要
標題 マルコフ決定過程におけるTD法による学習アルゴリズムについて(A learning algorithm of TD method for Markov decision processes)
執筆形態 共著
掲載誌名 京都大学数理解析研究所講究録1559「最適化問題における確率モデルの展開と応用」(Developments of probability models on optimization problems)
巻・号・頁 34-49頁
著者・共著者 M. Horiguchi, M. Yasuda and M. Kurano
概要 マルコフ決定過程における時間差分法による学習の研究。