Qwen2.5-Math
ベースモデルofficialmath
2024年9月19日公開。1兆トークン以上(Qwen Math Corpus v2)で学習した数学特化モデル。Chain-of-Thought(CoT)推論とTool-integrated Reasoning(TIR、Pythonインタプリタ使用)をサポート。中国語・英語バイリンガル。MATH 85.9%(Greedy)、TIR使用時は92.9%(RM@8)を達成。
ベンチマーク
MATH
85.9
gsm8k
95.2
mmlu-stem
81.5
olympiadbench
44
aime24
21
cmath
92.3
gaokao-math
72.8
ソース: Qwen2.5-Math Technical Report (arXiv:2409.12122)
技術仕様
アーキテクチャ
Qwen2.5 base, Chain-of-Thought reasoning, Tool-integrated Reasoning (TIR)
プロンプトテンプレート
フォーマット: chatml-math
システムプロンプト:
<|im_start|>system
Please reason step by step, and put your final answer within \boxed{}.<|im_end|>ユーザープロンプト:
<|im_start|>user
{prompt}<|im_end|>アシスタントプロンプト:
<|im_start|>assistant
ストップトークン:
<|im_start|><|im_end|>パラメータバリエーション
関連モデル
家系図
現在のモデル: Qwen2.5-Math