DeepSeek-V2.5

ベースモデル
開発者
DeepSeek AI
ライセンス
DeepSeek Model License
リリース日
2024/9/6
コンテキスト長
128,000 トークン
対応言語
en, zh, code
知識カットオフ
2024-Q3
ベースモデル
deepseek-v2
officialtext-generationcode-generationmoeunified

DeepSeek AIのV2.5統合モデル。2024年9月6日公開。DeepSeek-V2-0628とDeepSeek-Coder-V2-0724の長所を統合。汎用言語能力とコーディング能力を両立。

技術仕様

アーキテクチャ

Unified MoE combining V2 and Coder-V2

パラメータバリエーション

DeepSeek-V2.5(236B)

HuggingFace

V2とCoder-V2の統合モデル。汎用性とコード能力を両立。

MoEアクティブパラメータ: 21B
VRAM500GB

GGUFファイルは登録されていません

家系図

現在のモデル: DeepSeek-V2.5