| タイトルコード |
1000101288909 |
| 書誌種別 |
図書 |
| 書名 |
意思決定のためのアルゴリズム 1 |
| 巻次(漢字) |
1 |
| 書名ヨミ |
イシ ケッテイ ノ タメ ノ アルゴリズム |
| 各巻書名 |
確率的推論と逐次意思決定の基礎 |
| 言語区分 |
日本語 |
| 著者名 |
Mykel J.Kochenderfer/著
Tim A.Wheeler/著
Kyle H.Wray/著
林田 智弘/訳
西崎 一郎/訳
|
| 著者名ヨミ |
Mykel J Kochenderfer Tim A Wheeler Kyle H Wray ハヤシダ トモヒロ ニシザキ イチロウ |
| 著者名原綴 |
Kochenderfer Mykel J. Wheeler Tim A. Wray Kyle H. |
| 出版地 |
東京 |
| 出版者 |
朝倉書店
|
| 出版年月 |
2025.11 |
| 本体価格 |
¥6300 |
| ISBN |
978-4-254-12309-8 |
| ISBN |
4-254-12309-8 |
| 数量 |
8,216,26p |
| 大きさ |
26cm |
| 分類記号 |
417
|
| 件名 |
意思決定
アルゴリズム
|
| 注記 |
原タイトル:Algorithms for decision making |
| 注記 |
文献:巻末p2〜15 |
| 内容紹介 |
意思決定に関連する様々な話題を取り上げ、基礎となる数理計画問題の定式化と、それを解くためのアルゴリズムを図や例を交えて紹介する。演習問題も掲載。1は、確率的推論、逐次的問題を取り上げる。 |
| 目次タイトル |
1 序章 |
|
1.1 意思決定 1.2 アプリケーション 1.3 手法 1.4 歴史 1.5 社会的な影響 1.6 概略 |
|
第Ⅰ部 確率的推論 |
|
2 表現 |
|
2.1 信念度と確率 2.2 確率分布 2.3 同時分布 2.4 条件付き分布 2.5 ベイズネットワーク 2.6 条件付き独立性 2.7 要約 2.8 演習 |
|
3 推論 |
|
3.1 ベイズネットワークにおける推論 3.2 単純ベイズモデルにおける推論 3.3 和積変数除去 3.4 信念伝播 3.5 計算複雑性 3.6 直接サンプリング 3.7 尤度重み付きサンプリング 3.8 ギブスサンプリング 3.9 ガウスモデルにおける推論 3.10 要約 3.11 演習 |
|
4 パラメータ学習 |
|
4.1 最尤パラメータ学習 4.2 ベイズパラメータ学習 4.3 ノンパラメトリック学習 4.4 データ欠測がある場合の学習 4.5 要約 4.6 演習 |
|
5 構造学習 |
|
5.1 ベイズネットワークの評価 5.2 有向グラフ探索 5.3 マルコフ等価クラス 5.4 部分有向グラフ探索 5.5 要約 5.6 演習 |
|
6 単純な意思決定 |
|
6.1 合理的な選好に関する制約 6.2 効用関数 6.3 効用導出 6.4 期待効用最大化原理 6.5 意思決定ネットワーク 6.6 情報の価値 6.7 非合理性 6.8 要約 6.9 演習 |
|
第Ⅱ部 逐次的問題 |
|
7 厳密解法 |
|
7.1 マルコフ決定過程 7.2 方策評価 7.3 価値関数方策 7.4 方策反復 7.5 価値反復 7.6 非同期価値反復 7.7 線形計画の定式化 7.8 二次関数型報酬をもつ線形システム 7.9 要約 7.10 演習 |
|
8 近似価値関数 |
|
8.1 パラメトリック表現 8.2 最近傍 8.3 カーネル平滑化 8.4 線形補完 8.5 シンプレックス補完 8.6 線形回帰 8.7 ニューラルネットワーク回帰 8.8 要約 8.9 演習 |
|
9 オンライン計画 |
|
9.1 後退時間区間計画 9.2 ロールアウトによる先読み 9.3 前方探索 9.4 分枝限定法 9.5 スパースサンプリング 9.6 モンテカルロツリー探索 9.7 ヒューリスティック探索 9.8 ラベル付きヒューリスティック探索 9.9 開ループ計画 9.10 要約 9.11 演習 |
|
10 方策探索 |
|
10.1 方策評価近似 10.2 局所探索 10.3 遺伝的アルゴリズム 10.4 交差エントロピー法 10.5 進化戦略 10.6 等方性進化戦略 10.7 要約 10.8 演習 |
|
11 方策勾配推定 |
|
11.1 有限差分 11.2 回帰勾配 11.3 尤度比 11.4 未来報酬 11.5 基準値減算 11.6 要約 11.7 演習 |
|
12 方策勾配最適化 |
|
12.1 勾配上昇更新 12.2 制限された勾配更新 12.3 自然勾配更新 12.4 信頼領域の更新 12.5 クランプされた代理目的 12.6 要約 12.7 演習 |
|
13 アクター・クリティック法 |
|
13.1 アクター・クリティック 13.2 一般化アドバンテージ推定 13.3 決定論的方策勾配 13.4 モンテカルロツリー探索を用いたアクター・クリティック 13.5 要約 13.6 演習 |
|
14 方策検証 |
|
14.1 パフォーマンス指標の評価 14.2 希少事象に対するシミュレーション 14.3 ロバスト性分析 14.4 トレード分析 14.5 敵対的分析 14.6 要約 14.7 演習 |