Qwen2.5-Coder

ベースモデル

開発者

Alibaba Cloud / Qwen Team

ライセンス

Apache 2.0 (0.5B-32B except 3B), Qwen Research (3B)

リリース日

2024/11/12

コンテキスト長

131,072 トークン

トレーニングトークン

5.5T

対応言語

Python, JavaScript, TypeScript, Java, C++, C, Go, Rust, PHP, Ruby

ベースモデル

Qwen2.5

officialcoding

2024年11月12日公開。5.5兆トークン（70%コード、20%テキスト、10%数学）で学習したコード特化モデル。92言語のプログラミング言語をサポート。7B以上は128Kコンテキスト対応。HumanEval 92.7%、BigCodeBench・LiveCodeBenchでSOTA達成。

HuggingFace 論文 GitHub 公式サイト

ベンチマーク

HumanEval

92.7

humaneval-plus

87.6

mbpp

90

aider

73.7

mceval

65.9

ソース: Qwen2.5-Coder Technical Report (arXiv:2409.12186)

技術仕様

アーキテクチャ

Transformer, RoPE, SwiGLU, RMSNorm, GQA with QKV bias

プロンプトテンプレート

フォーマット: chatml

システムプロンプト:

<|im_start|>system
{system}<|im_end|>

ユーザープロンプト:

<|im_start|>user
{prompt}<|im_end|>

アシスタントプロンプト:

<|im_start|>assistant

ベース

FT

派生

表示中

Qwen2.5-Coder

ベンチマーク

技術仕様

アーキテクチャ

プロンプトテンプレート

パラメータバリエーション

Qwen2.5-Coder 0.5B(0.5B)

Qwen2.5-Coder 1.5B(1.5B)

Qwen2.5-Coder 3B(3B)

Qwen2.5-Coder 7B(7B)

Qwen2.5-Coder 14B(14B)

Qwen2.5-Coder 32B(32B)

関連モデル

Qwen1.5

CodeQwen1.5

Qwen2

Qwen2.5

Qwen2.5-Math

Qwen2.5-VL

QwQ

Qwen3

Qwen3-Coder

Qwen3-Embedding

Qwen3-VL

Qwen3-Next

家系図