強化学習アルゴリズム入門「平均」からはじめる基礎と応用

Name: 強化学習アルゴリズム入門 「平均」からはじめる基礎と応用
Brand: オーム社
SKU: 30512948
Price: 3300 JPY
Availability: InStock
Rating: 3.5 (1 reviews)

著者著：曽我部東馬

※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。「平均」という観点から強化学習の基本が理解できる！AlphaGoがプロ棋士を破った2016年以降、強...

電子書籍

税込 3,300 円 30pt

カートに入れる

ワンステップ購入

ワンステップ購入とはワンステップ購入とは

ほしい本に追加（値下がりすると通知がきます）

ご利用中のデバイスが対応しているかご確認ください

iOS
Android
Win
Mac

対応デバイスごとのコンテンツタイプやファイルサイズヘルプ

オンライン書店e-honで紙の本を見る

商品説明

※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。

「平均」という観点から強化学習の基本が理解できる！
AlphaGoがプロ棋士を破った2016年以降、強化学習や深層強化学習はさまざまな分野から注目を集めています。しかし、専門書では難解な専門用語や数式が多用されるため、初学者にとってはハードルが高い状態が続いていました。
本書は、そのハードルの高さを解消することを目的に制作されました。平均という初歩的な数学を使うことで、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。
また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては、PythonとMATLABの2種類のコードを、オーム社と著者のWebサイト、およびGithubで配布します。配布コードを実行することで、「原理→数式→プログラム」という一連の流れを直感的に把握できます。

【本書の特徴】
・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説します。
・さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較します。
・PythonとMATLAB、2種類のコードを配布します。

※Pythonのバージョンは3です。

第1章　平均から学ぶ強化学習の基本概念
第2章　各アルゴリズムの特徴と応用
第3章　関数近似手法
第4章　深層強化学習の原理と手法