サイト内検索

詳細検索

ヘルプ

セーフサーチについて

性的・暴力的に過激な表現が含まれる作品の表示を調整できる機能です。
ご利用当初は「セーフサーチ」が「ON」に設定されており、性的・暴力的に過激な表現が含まれる作品の表示が制限されています。
全ての作品を表示するためには「OFF」にしてご覧ください。
※セーフサーチを「OFF」にすると、アダルト認証ページで「はい」を選択した状態になります。
※セーフサーチを「OFF」から「ON」に戻すと、次ページの表示もしくはページ更新後に認証が入ります。

e-hon連携キャンペーン ~5/31

  1. hontoトップ
  2. 本の通販
  3. コンピュータ・IT・情報科学の通販
  4. 情報理論・情報科学の通販
  5. 科学情報出版の通販
  6. 詳解強化学習の発展と応用 ロボット制御・ゲーム開発のための実践的理論の通販

「honto 本の通販ストア」サービス終了及び外部通販ストア連携開始のお知らせ
詳細はこちらをご確認ください。

電子書籍化お知らせメール

商品が電子書籍化すると、メールでお知らせする機能です。
「メールを登録する」ボタンを押して登録完了です。
キャンセルをご希望の場合は、同じ場所から「メール登録を解除する」を押してください。

電子書籍化したら知らせてほしい

  • みんなの評価 5つ星のうち 未評価
  • あなたの評価 評価して"My本棚"に追加 評価ありがとうございます。×
  • カテゴリ:一般
  • 発売日:2024/03/19
  • 出版社: 科学情報出版
  • サイズ:21cm/212p
  • 利用対象:一般
  • ISBN:978-4-910558-27-1
  • 国内送料無料
専門書

紙の本

詳解強化学習の発展と応用 ロボット制御・ゲーム開発のための実践的理論 (設計技術シリーズ)新刊

著者 小林 泰介 (著)

強化学習の実現における課題とは何か? 強化学習を実世界の問題に応用することを目指したい研究者や技術者に向け、実応用向きの強化学習技術について、概念的な理解を重視しながら紹...

もっと見る

詳解強化学習の発展と応用 ロボット制御・ゲーム開発のための実践的理論 (設計技術シリーズ)

税込 3,960 36pt

予約購入とは

まだ販売されていない電子書籍の予約ができます。予約すると、販売開始日に自動的に決済されて本が読めます。

  • 商品は販売開始日にダウンロード可能となります。
  • 価格と販売開始日は変更となる可能性があります。
  • ポイント・クーポンはご利用いただけません。
  • 間違えて予約購入しても、予約一覧から簡単にキャンセルができます。
  • honto会員とクレジットカードの登録が必要です。未登録でも、ボタンを押せばスムーズにご案内します。

予約購入について詳しく見る

ワンステップ購入とは

ワンステップ購入とは、ボタンを1回押すだけでカートを通らずに電子書籍を購入できる機能です。

こんな方にオススメ

  • とにかくすぐ読みたい
  • 購入までの手間を省きたい
  • ポイント・クーポンはご利用いただけません。
  • 間違えて購入しても、完了ページもしくは購入履歴詳細から簡単にキャンセルができます。
  • 初めてのご利用でボタンを押すと会員登録(無料)をご案内します。購入する場合はクレジットカード登録までご案内します。

キャンセルについて詳しく見る

このセットに含まれる商品

前へ戻る

  • 対象はありません

次に進む

商品説明

強化学習の実現における課題とは何か? 強化学習を実世界の問題に応用することを目指したい研究者や技術者に向け、実応用向きの強化学習技術について、概念的な理解を重視しながら紹介する。【「TRC MARC」の商品解説】

【まえがき】※一部抜粋



本書では強化学習を実世界の問題に応用することを目指したい研究者(大学院生含め)や企業の技術者を主な対象にして,実応用向きの強化学習技術について紹介している.

これらは,過度に数理的な説明に踏み込みすぎずに概念的な理解を重視して説明するよう試みたつもりである.また,最近の強化学習論文では前提となっていて丁寧に紹介してもらえないテクニックや問題意識などについても適宜まとめているので,最新論文を読む下地としても有用であろう.

このように本書は,既存の強化学習ライブラリの利用方法をまとめたような入門書では満足できない,かと言って強化学習の詳細な数理に踏み込んで何故強化学習が上手く動くのかまで深く理解する段階ではない,いわば強化学習に入門を終えた強化学習ユーザー向けの構成となっている.

そのため,強化学習の基礎的な内容も本書には一応載せているが,比較的簡潔に留めたつもりである.また,本書を参考に新たな強化学習アルゴリズムの開発をすることも可能だと思うが,その際は必要に応じて他書や最新論文から理論的な補強をすると良いだろう.



本書は上記の対象を念頭に,まず1 章で強化学習の狙いや難しさを数理を一旦省いて言語的に紹介することで,大まかな思想を共有する.

その後に,その実現に必要とされる強化学習理論や最新技術の詳細を数理的に紹介していく.具体的には,2 章で強化学習の問題設定を数理的に改めるとともに,本書で必要となる幾つかの道具を紹介する.

3 章では,強化学習の最も基礎となる学習アルゴリズムと,近年の主流である深層強化学習で頻出の技術についてもまとめる.

4 章では,実世界への強化学習応用に向けた,行動として実数値を扱える強化学習手法の中の最新技術を,重要となる概念・技術とともに紹介する.

また5 章では,実世界でエージェントが効率良く学習するために有力な方法論であるモデルベース強化学習について,その基礎と応用法を分類分けしながらまとめる.

6 章では,実世界で強化学習を利用する際の恐らく最大の悩みの種となるであろう報酬の設計に関して,様々な対応策を簡潔に紹介する.最後に7 章では,筆者が今後特に期待している強化学習に関する話題を幾つか提供する.【商品解説】

目次

  • 第1章 強化学習とは
  • 1 – 1  強化学習の目的
  • 1 – 2  解決すべき課題
  • 1 – 2 – 1  間接的な教示
  • 1 – 2 – 2  データの収集

著者紹介

小林 泰介

略歴
2016年9月に名古屋大学大学院を短縮修了.博士(工学)取得.

2016年11月から2022年3月まで奈良先端大学院大学助教.

2022年4月から現在まで国立情報学研究所/総合研究大学院大学助教.

その他に,2016年4月から10月まで日本学術振興会特別研究員,2018年5月から2019年3月までミュンヘン工科大学滞在研究員,2020年12月から2022年3月までJSTさきがけ研究者として従事.

専門はヒューマノイドロボットを始めとする複雑なロボットの運動制御と,ロボット応用に向けた機械学習理論の開発.

関連キーワード

あわせて読みたい本

この商品に興味のある人は、こんな商品にも興味があります。

前へ戻る

  • 対象はありません

次に進む

この著者・アーティストの他の商品

前へ戻る

  • 対象はありません

次に進む

みんなのレビュー0件

みんなの評価0.0

評価内訳

  • 星 5 (0件)
  • 星 4 (0件)
  • 星 3 (0件)
  • 星 2 (0件)
  • 星 1 (0件)
×

hontoからおトクな情報をお届けします!

割引きクーポンや人気の特集ページ、ほしい本の値下げ情報などをプッシュ通知でいち早くお届けします。