CodeGemma

指示チューニング
開発者
Google DeepMind
ライセンス
Gemma Terms of Use
リリース日
2024/4/9
コンテキスト長
8,192 トークン
トレーニングトークン
500B-1T (code/math)
対応言語
en
知識カットオフ
2024
ベースモデル
gemma
officialcodingfill-in-middleinstruction-tuned

2024年4月9日公開(v1.1は5月)。Gemmaベースのコーディング特化モデル。Fill-in-the-Middle(FIM)学習(80% FIM率、50-50 PSM/SPM)採用。Dependency Graph-based Packing、Unit Test-based Lexical Packingで効率化。C++、C#、Go、Java、JavaScript、Kotlin、Python、Rust等対応。

ベンチマーク

HumanEval
60.4
humaneval-base
44.4
humaneval-plus
54.9
mbpp
67.2

ソース: https://arxiv.org/abs/2406.11409

技術仕様

アーキテクチャ

Gemma base, Fill-in-the-Middle (FIM), Dependency Graph-based Packing

プロンプトテンプレート

フォーマット: gemma-fim
ユーザープロンプト:
<start_of_turn>user
{user_message}<end_of_turn>
アシスタントプロンプト:
<start_of_turn>model
{assistant_response}<end_of_turn>
ストップトークン:
<end_of_turn><|file_separator|>

パラメータバリエーション

CodeGemma 2B(2B)

HuggingFace

軽量FIM版。コード補完に最適。

VRAM5GB

GGUFファイルは登録されていません

CodeGemma 7B(7B)

HuggingFace

標準FIM版。高精度コード補完。

VRAM17GB

GGUFファイルは登録されていません

CodeGemma 7B Instruct(7B)

HuggingFace

7B指示チューニング版。コード生成・説明に最適。

VRAM17GB

GGUFファイルは登録されていません

CodeGemma 1.1 7B Instruct(7B)

HuggingFace

v1.1指示チューニング版。改良版。

VRAM17GB

GGUFファイルは登録されていません

家系図

現在のモデル: CodeGemma