Gemma 3

ベースモデル
開発者
Google DeepMind
ライセンス
Gemma Terms of Use
リリース日
2025/3/12
コンテキスト長
128,000 トークン
対応言語
en, zh, ja, ko, de, fr, es, pt, it, ru, ar, hi, th, vi, id
知識カットオフ
2025-Q1
ベースモデル
gemma2
officialtext-generationvisionmultilinguallong-contextinstruction-tuned

2025年3月12日公開。128Kコンテキスト(4B以上)、140+言語対応。SigLIP Vision Encoder(896x896)搭載でマルチモーダル対応(4B以上)。5:1 Local-to-Global Attention、QAT対応チェックポイント提供。LMArena Elo 1338達成。

ベンチマーク

MMLU
76.9
MMLU-Pro
67.5
HumanEval
87.8
MATH
69
GPQA
42.4
mmmu
64.9
lmarena-elo
1338

ソース: https://arxiv.org/abs/2503.19786

技術仕様

アーキテクチャ

Decoder-only Transformer, 5:1 Local-to-Global Attention, RoPE (base freq 1M), SigLIP Vision Encoder, Pan & Scan, Bidirectional attention for images, QAT, Vocab 256K

プロンプトテンプレート

フォーマット: gemma3
ユーザープロンプト:
<start_of_turn>user
{user_message}<end_of_turn>
アシスタントプロンプト:
<start_of_turn>model
{assistant_response}<end_of_turn>
ストップトークン:
<end_of_turn><eos>

パラメータバリエーション

Gemma 3 270M(270M)

HuggingFace

最軽量版。32Kコンテキスト。テキストのみ。

VRAM1GB

GGUFファイルは登録されていません

Gemma 3 270M Instruct(270M)

HuggingFace

270M指示チューニング版。

VRAM1GB

GGUFファイルは登録されていません

Gemma 3 1B(1B)

HuggingFace

軽量版。32Kコンテキスト。テキストのみ。

VRAM3GB

GGUFファイルは登録されていません

Gemma 3 1B Instruct(1B)

HuggingFace

1B指示チューニング版。

VRAM3GB

GGUFファイルは登録されていません

Gemma 3 4B(4B)

HuggingFace

コンパクト版。128Kコンテキスト。ビジョン対応。Gemma 2-27B-ITを上回る性能。

VRAM10GB

GGUFファイルは登録されていません

Gemma 3 4B Instruct(4B)

HuggingFace

4B指示チューニング版。ビジョン対応。

VRAM10GB

GGUFファイルは登録されていません

Gemma 3 12B(12B)

HuggingFace

中型版。128Kコンテキスト。ビジョン対応。

VRAM28GB

GGUFファイルは登録されていません

Gemma 3 12B Instruct(12B)

HuggingFace

12B指示チューニング版。ビジョン対応。

VRAM28GB

GGUFファイルは登録されていません

Gemma 3 27B(27B)

HuggingFace

フラッグシップ版。128Kコンテキスト。ビジョン対応。

VRAM65GB

GGUFファイルは登録されていません

Gemma 3 27B Instruct(27B)

HuggingFace

27B指示チューニング版。ビジョン対応。LMArena Elo 1338達成。

VRAM65GB

GGUFファイルは登録されていません

家系図

現在のモデル: Gemma 3