サイト内検索

詳細
検索

ヘルプ

セーフサーチについて

性的・暴力的に過激な表現が含まれる作品の表示を調整できる機能です。
ご利用当初は「セーフサーチ」が「ON」に設定されており、性的・暴力的に過激な表現が含まれる作品の表示が制限されています。
全ての作品を表示するためには「OFF」にしてご覧ください。
※セーフサーチを「OFF」にすると、年齢認証ページで「はい」を選択した状態になります。
※セーフサーチを「OFF」から「ON」に戻すと、次ページの表示もしくはページ更新後に認証が入ります。

新規会員70%OFFクーポン

  1. 電子書籍ストア hontoトップ
  2. コンピュータ・IT・情報科学
  3. 情報理論・情報科学
  4. 講談社
  5. KS情報科学専門書
  6. 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで

アプリで立ち読み

hontoアプリの確認

立ち読みには最新の「honto」アプリ(無料)が必要です。

バージョンの確認はアプリの「設定/情報」から確認できます。

最新の「honto」アプリをご利用の方

立ち読みする

最新の「honto」アプリをダウンロードされる方

hontoビューアアプリ

  • みんなの評価 5つ星のうち 4 2件
  • あなたの評価 評価して"My本棚"に追加 評価ありがとうございます。×
  • 販売開始日: 2019/12/13
  • 出版社: 講談社
  • レーベル: KS情報科学専門書
  • ISBN:978-4-06-517251-3
一般書

機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで

著者 久保 隆宏

「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。...

もっと見る

機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで

税込 3,080 28pt

ワンステップ購入とは ワンステップ購入とは

ほしい本に追加(値下がりすると通知がきます)

ご利用中のデバイスが対応しているかご確認ください

  • ブラウザ
  • iOS
  • Android
  • Win
  • Mac

対応デバイスごとのコンテンツタイプやファイルサイズヘルプ

オンライン書店e-honとは

e-hon

hontoは「オンライン書店e-hon」との連携を開始しました。
e-hon」は書籍、雑誌、CD、DVD、雑貨といった多岐に渡る商品を取り扱う総合オンライン書店です。130万点以上の取り扱い点数、100万点以上の在庫により、欲しい商品を買い逃しません。honto会員向けにお得なキャンペーンを定期的に実施しています(キャンペーンに参加するにはMy書店をhontoに設定して頂く必要があります)。
・まだe-honの会員ではない方
下記リンクからe-honへ遷移し会員登録する際に自動でhontoがMy書店に設定されます。
・既にe-honをご利用いただいている方
「マイページ」-「会員情報の変更」-「My書店の変更」に進み、検索窓に「honto」と入力し、検索結果画面で会員登録ボタンを押すことでMy書店がhontoに設定されます。

e-honで紙の本を探す

※外部サイトに移動します。

対応デバイス毎のコンテンツタイプやファイルサイズ

対応デバイス コンテンツタイプ ファイルサイズ
ブラウザ EPUB
iOS EPUB 56.1MB
Android EPUB 56.1MB
Win EPUB 56.1MB
Mac EPUB 56.1MB

予約購入とは

まだ販売されていない電子書籍の予約ができます。予約すると、販売開始日に自動的に決済されて本が読めます。

  • 商品は販売開始日にダウンロード可能となります。
  • 価格と販売開始日は変更となる可能性があります。
  • ポイント・クーポンはご利用いただけません。
  • 間違えて予約購入しても、予約一覧から簡単にキャンセルができます。
  • honto会員とクレジットカードの登録が必要です。未登録でも、ボタンを押せばスムーズにご案内します。

予約購入について詳しく見る

ワンステップ購入とは

ワンステップ購入とは、ボタンを1回押すだけでカートを通らずに電子書籍を購入できる機能です。

こんな方にオススメ

  • とにかくすぐ読みたい
  • 購入までの手間を省きたい
  • ポイント・クーポンはご利用いただけません。
  • 間違えて購入しても、完了ページもしくは購入履歴詳細から簡単にキャンセルができます。
  • 初めてのご利用でボタンを押すと会員登録(無料)をご案内します。購入する場合はクレジットカード登録までご案内します。

キャンセルについて詳しく見る

商品説明

「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): 環境から計画を立てる 価値の定義と算出: Bellman Equation 動的計画法による状態評価の学習: Value Iteration 動的計画法による戦略の学習: Policy Iteration モデルベースとモデルフリーとの違いDay3 強化学習の解法(2): 経験から計画を立てる 経験の蓄積と活用のバランス: Epsilon-Greedy法 計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference 経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs PolicyベースDay4 強化学習に対するニューラルネットワークの適用 強化学習にニューラルネットワークを適用する 価値評価を、パラメーターを持った関数で実装する:Value Function Approximation 価値評価に深層学習を適用する:Deep Q-Network  戦略を、パラメーターを持った関数で実装する:Policy Gradient 戦略に深層学習を適用する:Advantage Actor Critic (A2C) 価値評価か、戦略かDay5 強化学習の弱点 サンプル効率が悪い 局所最適な行動に陥る、過学習をすることが多い 再現性が低い 弱点を前提とした対応策Day6 強化学習の弱点を克服するための手法 サンプル効率の悪さへの対応: モデルベースとの併用/表現学習 再現性の低さへの対応: 進化戦略 局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7 強化学習の活用領域 行動の最適化 学習の最適化

目次

  • Day1 強化学習の位置づけを知る
  •  強化学習とさまざまなキーワードの関係
  •  強化学習のメリット・デメリット
  •  強化学習における問題設定:Markov Decision Process 
  • Day2 強化学習の解法(1): 環境から計画を立てる
  •  価値の定義と算出: Bellman Equation
  •  動的計画法による状態評価の学習: Value Iteration
  •  動的計画法による戦略の学習: Policy Iteration
  •  モデルベースとモデルフリーとの違い

この著者・アーティストの他の商品

前へ戻る

  • 対象はありません

次に進む

小分け商品

前へ戻る

  • 対象はありません

次に進む

この商品の他ラインナップ

前へ戻る

  • 対象はありません

次に進む

みんなのレビュー2件

みんなの評価4.0

評価内訳

  • 星 5 (0件)
  • 星 4 (2件)
  • 星 3 (0件)
  • 星 2 (0件)
  • 星 1 (0件)

2020/02/23 12:02

投稿元:ブクログ

レビューを見る

2020/07/23 11:17

投稿元:ブクログ

レビューを見る

実施中のおすすめキャンペーン

本の通販連携サービス

このページの先頭へ

×

hontoからおトクな情報をお届けします!

割引きクーポンや人気の特集ページ、ほしい本の値下げ情報などをプッシュ通知でいち早くお届けします。