Llama 3

ベースモデル
開発者
Meta
ライセンス
Meta Llama 3 Community License
リリース日
2024/4/18
コンテキスト長
8,192 トークン
トレーニングトークン
15T+
対応言語
en
知識カットオフ
2023-03 (8B) / 2023-12 (70B)
officialmultilingual

2024年4月18日公開。語彙サイズを128Kトークンに4倍拡大し、15兆トークン以上で学習した第3世代モデル。全サイズでGQA採用。8Bモデルで従来のLlama 2 70Bに匹敵する性能を実現。事前学習・微調整ともにMetaユーザーデータを含まないことを明言。

技術仕様

アーキテクチャ

Auto-regressive Decoder-only Transformer (全モデルGQA)

プロンプトテンプレート

フォーマット: llama-3
システムプロンプト:
<|start_header_id|>system<|end_header_id|>

{system}<|eot_id|>
ユーザープロンプト:
<|start_header_id|>user<|end_header_id|>

{prompt}<|eot_id|>
アシスタントプロンプト:
<|start_header_id|>assistant<|end_header_id|>

ストップトークン:
<|eot_id|><|end_of_text|>

パラメータバリエーション

Meta Llama 3 8B(8B)

HuggingFace

軽量ベースモデル。GQA採用で推論効率向上。

VRAM6GB
RAM16GB

GGUFファイルは登録されていません

Meta Llama 3 8B Instruct(8B)

HuggingFace

指示追従最適化版。SFT+RLHFで調整。

VRAM6GB
RAM16GB

GGUFファイルは登録されていません

Meta Llama 3 70B(70B)

HuggingFace

大規模ベースモデル。多くのベンチマークでGPT-4に迫る性能。

VRAM40GB
RAM140GB

GGUFファイルは登録されていません

Meta Llama 3 70B Instruct(70B)

HuggingFace

指示追従最適化版。SFT+RLHFで調整。

VRAM40GB
RAM140GB

GGUFファイルは登録されていません

家系図

現在のモデル: Llama 3