Qwen2.5-Math

ベースモデル

開発者

Alibaba Cloud / Qwen Team

ライセンス

Apache 2.0

リリース日

2024/9/19

コンテキスト長

4,096 トークン

トレーニングトークン

1T+

対応言語

zh, en

知識カットオフ

2024

ベースモデル

Qwen2.5

officialmath

2024年9月19日公開。1兆トークン以上（Qwen Math Corpus v2）で学習した数学特化モデル。Chain-of-Thought（CoT）推論とTool-integrated Reasoning（TIR、Pythonインタプリタ使用）をサポート。中国語・英語バイリンガル。MATH 85.9%（Greedy）、TIR使用時は92.9%（RM@8）を達成。

HuggingFace 論文 GitHub 公式サイト

ベンチマーク

MATH

85.9

gsm8k

95.2

mmlu-stem

81.5

olympiadbench

44

aime24

21

cmath

92.3

gaokao-math

72.8

ソース: Qwen2.5-Math Technical Report (arXiv:2409.12122)

技術仕様

アーキテクチャ

Qwen2.5 base, Chain-of-Thought reasoning, Tool-integrated Reasoning (TIR)

プロンプトテンプレート

フォーマット: chatml-math

システムプロンプト:

<|im_start|>system
Please reason step by step, and put your final answer within \boxed{}.<|im_end|>

ユーザープロンプト:

<|im_start|>user
{prompt}<|im_end|>

アシスタントプロンプト:

<|im_start|>assistant

ベース

FT

派生

表示中

Qwen2.5-Math

ベンチマーク

技術仕様

アーキテクチャ

プロンプトテンプレート

パラメータバリエーション

Qwen2.5-Math 1.5B(1.5B)

Qwen2.5-Math 7B(7B)

Qwen2.5-Math 72B(72B)

Qwen2.5-Math-RM 72B(72B)

関連モデル

Qwen1.5

CodeQwen1.5

Qwen2

Qwen2.5

Qwen2.5-Coder

Qwen2.5-VL

QwQ

Qwen3

Qwen3-Coder

Qwen3-Embedding

Qwen3-VL

Qwen3-Next

家系図