サイト内検索

詳細検索

ヘルプ

セーフサーチについて

性的・暴力的に過激な表現が含まれる作品の表示を調整できる機能です。
ご利用当初は「セーフサーチ」が「ON」に設定されており、性的・暴力的に過激な表現が含まれる作品の表示が制限されています。
全ての作品を表示するためには「OFF」にしてご覧ください。
※セーフサーチを「OFF」にすると、アダルト認証ページで「はい」を選択した状態になります。
※セーフサーチを「OFF」から「ON」に戻すと、次ページの表示もしくはページ更新後に認証が入ります。

【HB】3冊以上でポイント3倍キャンペーン(~8/31)

【HB】3冊以上でポイント3倍キャンペーン(~8/31)

電子書籍化お知らせメール

商品が電子書籍化すると、メールでお知らせする機能です。
「メールを登録する」ボタンを押して登録完了です。
キャンセルをご希望の場合は、同じ場所から「メール登録を解除する」を押してください。

電子書籍化したら知らせてほしい

速習強化学習 基礎理論とアルゴリズム
  • みんなの評価 5つ星のうち 4 1件
  • あなたの評価 評価して"My本棚"に追加 評価ありがとうございます。×
  • カテゴリ:一般
  • 発売日:2017/09/21
  • 出版社: 共立出版
  • サイズ:24cm/132p
  • 利用対象:一般
  • ISBN:978-4-320-12422-6
  • 国内送料無料
専門書

紙の本

速習強化学習 基礎理論とアルゴリズム

著者 Csaba Szepesvári (著),小山田 創哲 (訳者代表・編集),前田 新一 (監訳),小山 雅典 (監訳)

強化学習を体系的に学べるテキスト。動的計画法に基づいた強化学習のアルゴリズムに主眼を置いて解説し、多岐にわたる学習問題を挙げ、それらを解くアルゴリズムやアイデア、その理論...

もっと見る

速習強化学習 基礎理論とアルゴリズム

3,240(税込)

ワンステップ購入とは

ワンステップ購入とは、ボタンを1回押すだけでカートを通らずに電子書籍を購入できる機能です。

こんな方にオススメ

  • とにかくすぐ読みたい
  • 購入までの手間を省きたい
  • ポイント・クーポンはご利用いただけません。
  • 間違えて購入しても、完了ページもしくは購入履歴詳細から簡単にキャンセルができます。
  • 初めてのご利用でボタンを押すと会員登録(無料)をご案内します。購入する場合はクレジットカード登録までご案内します。

キャンセルについて詳しく見る

新刊お知らせメール登録

この著者の新着情報

一覧を見る

あわせて読みたい本

この商品に興味のある人は、こんな商品にも興味があります。

前へ戻る

  • 対象はありません

次に進む

このセットに含まれる商品

前へ戻る

  • 対象はありません

次に進む

商品説明

強化学習を体系的に学べるテキスト。動的計画法に基づいた強化学習のアルゴリズムに主眼を置いて解説し、多岐にわたる学習問題を挙げ、それらを解くアルゴリズムやアイデア、その理論的特徴と制約について論じる。【「TRC MARC」の商品解説】

 GoogleのAlphaGoによるプロ棋士打破は,人工知能がヒトを超えた学習を行った歴史的出来事として認識された。強化学習はここで重要な役割を果たしてているだけでなく,自動運転やロボット制御などの重要な分野への応用も知られ,いま世間の強い関心を集めている。その一方,日本語で強化学習を体系的に学べる教科書は多くはなく,代表的な教科書であるSutton and Barto (1998)とその訳書も出版から20年が経とうとしている。
 本書はトップ会議のチュートリアルで利用されたり,2010年の出版以降わずか数年で500弱の引用がされたりという事実からも窺えるように,入門書として広く読まれている良書である。本書の内容は動的計画法などの基本的かつ重要なアルゴリズムに始まり,比較的新しい手法も体系的に網羅しつつもコンパクトに自己完結している。原著の出版から7年あまり経つが,近年の発展は本書で掲載されたアルゴリズム・アイデアをその基礎においている。特に本書では,深層学習を利用した深層強化学習を含む最近の発展に,本書で紹介されたアルゴリズムがどのように使われているかを解説した訳者補遺を追加することで,本書と最先端の研究との橋渡しをしている。【商品解説】

目次

  • 第1章 マルコフ決定過程
  • 1.1 本書の表記と前提とする知識
  • 1.2 マルコフ決定過程
  • 1.3 価値関数
  • 1.4 MDPを解くための動的計画法
  • 第2章 価値推定問題
  • 2.1 有限な状態空間でのTD学習
  •  2.1.1 テーブルTD(0)法
  •  2.1.2 逐一訪問モンテカルロ法

関連キーワード

この著者・アーティストの他の商品

前へ戻る

  • 対象はありません

次に進む

みんなのレビュー1件

みんなの評価4.0

評価内訳

  • 星 5 (0件)
  • 星 4 (1件)
  • 星 3 (0件)
  • 星 2 (0件)
  • 星 1 (0件)

2017/12/02 12:53

投稿元:ブクログ

レビューを見る

情報理論・情報科学 ランキング

情報理論・情報科学のランキングをご紹介します一覧を見る

前へ戻る

次に進む