Qwen2.5-Coder
ベースモデルofficialcoding
2024年11月12日公開。5.5兆トークン(70%コード、20%テキスト、10%数学)で学習したコード特化モデル。92言語のプログラミング言語をサポート。7B以上は128Kコンテキスト対応。HumanEval 92.7%、BigCodeBench・LiveCodeBenchでSOTA達成。
ベンチマーク
HumanEval
92.7
humaneval-plus
87.6
mbpp
90
aider
73.7
mceval
65.9
ソース: Qwen2.5-Coder Technical Report (arXiv:2409.12186)
技術仕様
アーキテクチャ
Transformer, RoPE, SwiGLU, RMSNorm, GQA with QKV bias
プロンプトテンプレート
フォーマット: chatml
システムプロンプト:
<|im_start|>system
{system}<|im_end|>ユーザープロンプト:
<|im_start|>user
{prompt}<|im_end|>アシスタントプロンプト:
<|im_start|>assistant
ストップトークン:
<|im_end|><|endoftext|>パラメータバリエーション
関連モデル
家系図
現在のモデル: Qwen2.5-Coder