蔵書情報
この資料の蔵書に関する統計情報です。現在の所蔵数 在庫数 予約数などを確認できます。
書誌情報サマリ
書名 |
マルコフ決定過程
|
著者名 |
中出 康一/著
|
著者名ヨミ |
ナカデ コウイチ |
出版者 |
コロナ社
|
出版年月 |
2019.4 |
この資料に対する操作
電子書籍を読むを押すと 電子図書館に移動しこの資料の電子書籍を読むことができます。
資料情報
各蔵書資料に関する詳細情報です。
No. |
所蔵館 |
配架場所 |
請求記号 |
資料番号 |
資料種別 |
状態 |
個人貸出 |
在庫
|
1 |
西部図書館 | 一般開架 | 4171/67/ | 1102529609 | 一般 | 在庫 | 可 |
○ |
書誌詳細
この資料の書誌詳細情報です。
タイトルコード |
1000100696770 |
書誌種別 |
図書 |
書名 |
マルコフ決定過程 |
書名ヨミ |
マルコフ ケッテイ カテイ |
|
理論とアルゴリズム |
叢書名 |
シリーズ情報科学における確率モデル
|
叢書番号 |
4 |
言語区分 |
日本語 |
著者名 |
中出 康一/著
|
著者名ヨミ |
ナカデ コウイチ |
出版地 |
東京 |
出版者 |
コロナ社
|
出版年月 |
2019.4 |
本体価格 |
¥2900 |
ISBN |
978-4-339-02834-8 |
ISBN |
4-339-02834-8 |
数量 |
8,190p |
大きさ |
21cm |
分類記号 |
417.1
|
件名 |
マルコフ過程
|
注記 |
文献:p186〜188 |
内容紹介 |
一冊でマルコフ決定過程の理論を学べるように、基礎となる動的計画法、確率変数、確率過程と、マルコフ決定過程の各種最適化規範について詳しく解説。近似アルゴリズムと強化学習に関連する事項の基本的な内容も記述する。 |
著者紹介 |
京都大学大学院工学研究科修士課程修了(数理工学専攻)。名古屋工業大学教授。 |
目次タイトル |
第1章 マルコフ決定過程の概要 |
|
1.1 ORと確率モデル 1.2 動的計画法 1.3 マルコフ決定過程 1.4 定式化の例 1.5 マルコフ決定過程の拡張と発展 |
|
第2章 マルコフ連鎖と再生過程 |
|
2.1 離散型確率変数 2.2 連続型確率変数 2.3 離散時間マルコフ連鎖 2.4 周期 2.5 マルコフ連鎖の定常確率と極限確率 2.6 有限マルコフ連鎖 2.7 再生過程 2.8 再生報酬過程 2.9 マルコフ報酬過程 2.10 セミマルコフ過程 2.11 連続時間マルコフ連鎖 |
|
第3章 有限期間総期待利得マルコフ決定過程 |
|
3.1 有限期間総期待利得問題 3.2 最適性方程式 3.3 値反復法 3.4 数値例 |
|
第4章 総割引期待利得マルコフ決定過程 |
|
4.1 無限期間総割引期待利得 4.2 最適性方程式と理論的性質 4.3 計算アルゴリズム |
|
第5章 平均利得マルコフ決定過程 |
|
5.1 平均利得 5.2 平均利得に関する関係式 5.3 相対値と平均利得 5.4 総割引期待利得と平均利得の関係 5.5 マルコフ決定過程の分類 5.6 計算アルゴリズム(単一連鎖の場合) 5.7 計算アルゴリズム(多重連鎖の場合) |
|
第6章 セミマルコフ決定過程 |
|
6.1 セミマルコフ決定過程とは 6.2 総割引期待利得 6.3 平均利得 6.4 連続時間マルコフ決定過程(推移間隔が指数分布に従う場合) |
|
第7章 部分観測可能マルコフ決定過程 |
|
7.1 部分観測可能マルコフ決定過程とは 7.2 信念 7.3 定式化 7.4 値関数の線形性 7.5 ベクトル集合の生成 |
|
第8章 マルコフ決定過程の展開 |
|
8.1 近似最適化アルゴリズム 8.2 強化学習とマルコフ決定過程 8.3 決定直後の状態を用いた近似アルゴリズム 8.4 最適政策の性質 |
内容細目
関連資料
この資料に関連する資料を 同じ著者 出版年 分類 件名 受賞などの切り口でご紹介します。
前のページへ