Gemma 3
ベースモデルofficialtext-generationvisionmultilinguallong-contextinstruction-tuned
2025年3月12日公開。128Kコンテキスト(4B以上)、140+言語対応。SigLIP Vision Encoder(896x896)搭載でマルチモーダル対応(4B以上)。5:1 Local-to-Global Attention、QAT対応チェックポイント提供。LMArena Elo 1338達成。
ベンチマーク
MMLU
76.9
MMLU-Pro
67.5
HumanEval
87.8
MATH
69
GPQA
42.4
mmmu
64.9
lmarena-elo
1338
ソース: https://arxiv.org/abs/2503.19786
技術仕様
アーキテクチャ
Decoder-only Transformer, 5:1 Local-to-Global Attention, RoPE (base freq 1M), SigLIP Vision Encoder, Pan & Scan, Bidirectional attention for images, QAT, Vocab 256K
プロンプトテンプレート
フォーマット: gemma3
ユーザープロンプト:
<start_of_turn>user
{user_message}<end_of_turn>アシスタントプロンプト:
<start_of_turn>model
{assistant_response}<end_of_turn>ストップトークン:
<end_of_turn><eos>パラメータバリエーション
Gemma 3 27B Instruct(27B)
HuggingFace27B指示チューニング版。ビジョン対応。LMArena Elo 1338達成。
VRAM65GB
GGUFファイルは登録されていません
関連モデル
家系図
現在のモデル: Gemma 3