紙の本
強化学習アルゴリズム入門 「平均」からはじめる基礎と応用
著者 曽我部 東馬 (著)
難解な専門用語が数多く登場する強化学習の理論を、わかりやすい「平均」の考えかたを用いて解説。原理→数式→プログラムの流れで、全体像を直感的に把握できる。PythonとMA...
強化学習アルゴリズム入門 「平均」からはじめる基礎と応用
強化学習アルゴリズム入門 「平均」からはじめる基礎と応用
ワンステップ購入とは ワンステップ購入とは
あわせて読みたい本
前へ戻る
- 対象はありません
次に進む
このセットに含まれる商品
前へ戻る
- 対象はありません
次に進む
商品説明
難解な専門用語が数多く登場する強化学習の理論を、わかりやすい「平均」の考えかたを用いて解説。原理→数式→プログラムの流れで、全体像を直感的に把握できる。PythonとMATLABのコードはダウンロード可能。【「TRC MARC」の商品解説】
「平均」の観点から強化学習の原理がわかる!
AlphaGoがプロ棋士を破った2016年以降、さまざまな分野から注目されている深層強化学習ですが、専門書は非常に難解でわかりづらい傾向にあります。
そこで本書は、初歩的な数学を使って原理をわかりやすく解説します。価値・探索・マルコフ決定過程・動的計画法・モンテカルロ法・TD法といった強化学習の諸要素を、中高生にもなじみ深い平均値の計算から説明し、初学者でも基本とコツを自然と身につけられます。抽象的な強化学習の概念と煩雑な数学式を直感的に感じつつ、本質まで把握できることが本書の最大の特徴です。
また、すべての例題にPythonとMATLABのコードを示し、原理・数式・コードという一連の流れを紐付けて理解できるようになっています。初学者でも入りやすく、難しさを感じないまま、強化学習の基本と深層学習のコツを自然と身につけられる入門書です。
【本書の特徴】
・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説しています。
・すべての例題にPythonとMATLABのコードを例示しています。【商品解説】
著者紹介
曽我部 東馬
- 略歴
- 〈曽我部東馬〉理学博士(物理学専攻)。電気通信大学准教授、株式会社グリッド最高技術顧問、東京大学先端科学技術研究センター客員研究員。
この著者・アーティストの他の商品
前へ戻る
- 対象はありません
次に進む