これからの強化学習

著者牧野貴樹（編著）,澁谷長史（編著）,白川真一（編著）,浅田稔（ほか著）

ロボット制御、金融工学、言語処理、生産現場やサービスの最適化、最強の囲碁ＡＩ…。あらゆる分野で威力を発揮しつつある強化学習の基礎・発展・応用を多面的に解説する。【「TRC...

紙の本

これからの強化学習

税込 4,620 円 42pt

+

このセットに含まれる商品

前へ戻る

対象はありません

次に進む

商品説明

ロボット制御、金融工学、言語処理、生産現場やサービスの最適化、最強の囲碁ＡＩ…。あらゆる分野で威力を発揮しつつある強化学習の基礎・発展・応用を多面的に解説する。【「TRC MARC」の商品解説】

◆強化学習は「ポストビッグデータ」の技術である！
人工知能，金融工学，ロボット制御，言語処理，生産現場やサービスの最適化，あらゆる分野に応用が広がる強化学習．十分なデータが与えられることが前提とされる他の機械学習法と異なり，「足りないデータを集めながら最適化すること」に力点を置く強化学習は，ビッグデータの先を行くための重要な技術となることが期待されます．

◆強化学習の「いま」を知り，「これから」を切り拓くための1冊．
本書では，この分野を代表する執筆陣が集い，強化学習の基礎・発展・応用を多面的に解説します．
・基礎：強化学習の動作原理と基本アルゴリズムを，初学者でも分かるように導入．
・発展：より複雑な問題に対処し，高度な研究に進むための，さまざまな発展的手法を解説．
・応用：マルチロボットシステムの制御，対話処理，医療データ分析，囲碁の対局など広範な応用例・研究事例を通して，強化学習の活用法を紹介．人間の行動や脳の動作を説明するモデルとしての理論・実験も解説．

――強化学習の基礎を学びたい方，発展的手法に触れたい方，応用可能性を一望したい方に最適な1冊！【商品解説】

第1章　強化学習の基礎的理論
強化学習とは／強化学習の構成要素／価値関数に基づくアルゴリズム／改善に基づくアルゴリズム／部分観測マルコフ決定過程と強化学習
第2章　強化学習の発展的理論
統計学習の観点から見たTD学習／強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化／逆強化学習／試行錯誤回数の低減を指向した手法：経験強化型学習XoL／群強化学習法／リスク考慮型強化学習／複利型強化学習
第3章　強化学習の工学応用
高次元・実環境における強化学習／連続的な状態・行動空間への拡張：マルチロボットシステムへの適用／対話処理における強化学習／マルチエージェント系の報酬設計／自然言語処理における逆強化学習・模倣学習の適用／医療臨床データ分析への応用／深層学習を用いたQ関数の学習：Atariと囲碁への応用
第4章　知能のモデルとしての強化学習