DeepSeek-R1-Distill-Llama

ファインチューニング
開発者
DeepSeek
ライセンス
MIT License
リリース日
2025/1/20
コンテキスト長
128,000 トークン
対応言語
en, zh

DeepSeek社がDeepSeek-R1の推論能力をLlama 3ベースモデルに蒸留したモデル。長い思考連鎖(Chain-of-Thought)による高度な推論能力を持ち、数学・コーディング・論理的推論タスクで優れた性能を発揮。

技術仕様

アーキテクチャ

Transformer with GQA

パラメータバリエーション

DeepSeek-R1-Distill-Llama-8B(8B)

HuggingFace

Llama 3 8Bベースの蒸留モデル。軽量ながら高度な推論能力を持つ。

GGUFファイルは登録されていません

DeepSeek-R1-Distill-Llama-70B(70B)

HuggingFace

Llama 3 70Bベースの蒸留モデル。DeepSeek-R1に匹敵する推論能力を発揮。

GGUFファイルは登録されていません

家系図

現在のモデル: DeepSeek-R1-Distill-Llama