大規模言語モデル入門
著者 著者・監修:山田 育矢 , 著者:鈴木 正敏
ChatGPTに代表される大規模言語モデルが自然言語処理の幅広いタスクで高い性能を獲得し,大きな話題となっています。大規模言語モデルは,大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。2020年以降,自然言語処理や機械学習の知見をもとに,パラメータ数とテキストデータの拡大により,性能が飛躍的に向上しました。
Hugging Face社のtransformers"というPythonライブラリを利用することで,プログラミングの経験があれば,モデルの操作やデータからの学習がかんたんにできます。モデルを訓練するための日本語もしくは日本語を含む多言語のデータセットも充実してきており,すぐに業務に使える実用的なモデルを作ることが可能な時代がやってきました。本書は,大規模言語モデルの理論と実装の両方を解説した入門書です。大規模言語モデルの技術や自然言語処理の課題について理解し,実際の問題に対処できるようになることを目指しています。以下のような構成によって,理論とプログラミングの双方の側面から,大規模言語モデルに関する情報を提供します。
■こんな方におすすめ
・大規模言語モデルに興味のあるエンジニア,学生,研究者
■目次
第1章 はじめに
1.1 transformersを使って自然言語処理を解いてみよう
1.2 transformersの基本的な使い方
1.3 単語埋め込みとニューラルネットワークの基礎
・・・
第2章 Transformer
2.1 概要
2.2 エンコーダ
2.3 エンコーダ・デコーダ
・・・
第3章 大規模言語モデルの基礎
3.1 単語の予測から学習できること
3.2 GPT(デコーダ)
3.3 BERT・RoBERTa(エンコーダ)
・・・
第4章 大規模言語モデルの進展
4.1 モデルの大規模化とその効果
4.2 プロンプトによる言語モデルの制御
4.3 アライメントの必要性
・・・
第5章 大規模言語モデルのファインチューニング
5.1 日本語ベンチマーク:JGLUE
5.2 感情分析モデルの実装
5.3 感情分析モデルのエラー分析
・・・
第6章 固有表現認識
6.1 固有表現認識とは
6.2 データセット・前処理・評価指標
6.3 固有表現認識モデルの実装
・・・
第7章 要約生成
7.1 要約生成とは
7.2 データセット
7.3 評価指標
7.4 見出し生成モデルの実装
第8章 文埋め込み
8.1 文埋め込みとは.
8.2 文埋め込みモデルSimCSE
8.3 文埋め込みモデルの実装
8.4 最近傍探索ライブラリFaissを使った検索
第9章 質問応答
9.1 質問応答システムのしくみ
9.2 データセットと評価指標
9.3 ChatGPTにクイズを答えさせる
9.4 文書検索モデルの実装
・・・
大規模言語モデル入門
ワンステップ購入とは ワンステップ購入とは
この著者・アーティストの他の商品
前へ戻る
- 対象はありません
次に進む
評価内訳
- 星 5 (0件)
- 星 4 (0件)
- 星 3 (0件)
- 星 2 (0件)
- 星 1 (0件)