CodeGemma

指示チューニング

開発者

Google DeepMind

ライセンス

Gemma Terms of Use

リリース日

2024/4/9

コンテキスト長

8,192 トークン

トレーニングトークン

500B-1T (code/math)

対応言語

en

知識カットオフ

2024

ベースモデル

gemma

officialcodingfill-in-middleinstruction-tuned

2024年4月9日公開（v1.1は5月）。Gemmaベースのコーディング特化モデル。Fill-in-the-Middle（FIM）学習（80% FIM率、50-50 PSM/SPM）採用。Dependency Graph-based Packing、Unit Test-based Lexical Packingで効率化。C++、C#、Go、Java、JavaScript、Kotlin、Python、Rust等対応。

HuggingFace 論文 GitHub 公式サイト

ベンチマーク

HumanEval

60.4

humaneval-base

44.4

humaneval-plus

54.9

mbpp

67.2

ソース: https://arxiv.org/abs/2406.11409

技術仕様

アーキテクチャ

Gemma base, Fill-in-the-Middle (FIM), Dependency Graph-based Packing

プロンプトテンプレート

フォーマット: gemma-fim

ユーザープロンプト:

<start_of_turn>user
{user_message}<end_of_turn>

アシスタントプロンプト:

<start_of_turn>model
{assistant_response}<end_of_turn>

ベース

FT

派生

表示中

CodeGemma

ベンチマーク

技術仕様

アーキテクチャ

プロンプトテンプレート

パラメータバリエーション

CodeGemma 2B(2B)

CodeGemma 7B(7B)

CodeGemma 7B Instruct(7B)

CodeGemma 1.1 7B Instruct(7B)

関連モデル

Gemma

Gemma 2

ShieldGemma

Gemma 3

ShieldGemma 2

TranslateGemma

Gemma 3n

FunctionGemma

EmbeddingGemma

家系図