DeepSeek-R1
ファインチューニングDeepSeek AIの推論特化モデル。2025年1月20日公開。R1-Zeroは純粋RL学習のみで推論能力を検証した初のモデル。R1はコールドスタートデータ+RLで可読性向上。AIME 2024で79.8% Pass@1、MATH-500で97.3%達成。6種類の蒸留モデル(Qwen/Llamaベース)も提供。MITライセンス。
ベンチマーク
ソース: https://arxiv.org/abs/2501.12948
技術仕様
アーキテクチャ
MoE based on DeepSeek-V3, Self-verification, Reflection, Long Chain-of-Thought generation, Maximum generation length 32,768 tokens
プロンプトテンプレート
<|begin▁of▁sentence|><|User|>{user_message}<|Assistant|><|think|>{reasoning_process}
<|/think|>
{final_answer}<|end▁of▁sentence|><|end▁of▁sentence|>パラメータバリエーション
DeepSeek-R1-Zero(671B)
HuggingFace純粋RL学習のみで推論能力を検証した初のモデル。SFTなし。
GGUFファイルは登録されていません
DeepSeek-R1(671B)
HuggingFaceフルサイズ推論モデル。AIME 2024で79.8% Pass@1達成。
GGUFファイルは登録されていません
DeepSeek-R1-Distill-Qwen-1.5B(1.5B)
HuggingFaceQwen2.5-1.5Bベースの蒸留モデル。80万件の推論サンプルで学習。
GGUFファイルは登録されていません
DeepSeek-R1-Distill-Qwen-32B(32B)
HuggingFaceQwen2.5-32Bベースの蒸留モデル。AIME 2024で72.6% Pass@1、OpenAI o1-miniを上回る。
GGUFファイルは登録されていません
DeepSeek-R1-Distill-Llama-70B(70B)
HuggingFaceLlama 3.1-70Bベースの蒸留モデル。最大の蒸留版。
GGUFファイルは登録されていません
関連モデル
DeepSeek-LLM
4 バリエーション
DeepSeek-Coder
7 バリエーション
DeepSeekMoE
2 バリエーション
DeepSeek-Math
3 バリエーション
DeepSeek-VL
2 バリエーション
DeepSeek-V2
4 バリエーション
DeepSeek-Coder-V2
4 バリエーション
DeepSeek-Prover
1 バリエーション
DeepSeek-V2.5
1 バリエーション
DeepSeek-V3
2 バリエーション
DeepSeek-VL2
3 バリエーション
Janus
3 バリエーション
DeepSeek-R1-0528
1 バリエーション
DeepSeek-V3.1
1 バリエーション
DeepSeek-Prover-V2
2 バリエーション
DeepSeekMath-V2
1 バリエーション
DeepSeek-V3.2
1 バリエーション
家系図
現在のモデル: DeepSeek-R1