DeepSeek-VL2
ファインチューニングofficialvisionmultimodalmoeocrdocument-understanding
DeepSeek AIの第2世代Vision-Language MoEモデル。2024年12月13日公開。384x384基本解像度で動的タイリング対応。Tiny(33.7B/10B活性化)、Small(161B/28B活性化)、フル(275B/45B活性化)の3サイズ展開。OCR、文書理解、チャート分析に強い。
ベンチマーク
mmstar-tiny
45.9
ocrbench-tiny
809
docvqa-tiny
88.9
chartqa-tiny
81
mathvista-tiny
53.6
ソース: https://arxiv.org/abs/2412.10302
技術仕様
アーキテクチャ
Vision-Language MoE, 384x384 base resolution, Dynamic tiling
パラメータバリエーション
DeepSeek-VL2-Tiny(33.7B)
HuggingFace33.7B総パラメータ、10B活性化の軽量版。MMStar 45.9、OCRBench 809達成。
MoEアクティブパラメータ: 10B
VRAM70GB
GGUFファイルは登録されていません
DeepSeek-VL2-Small(161B)
HuggingFace161B総パラメータ、28B活性化の中型版。
MoEアクティブパラメータ: 28B
VRAM350GB
GGUFファイルは登録されていません
関連モデル
DeepSeek-LLM
4 バリエーション
DeepSeek-Coder
7 バリエーション
DeepSeekMoE
2 バリエーション
DeepSeek-Math
3 バリエーション
DeepSeek-VL
2 バリエーション
DeepSeek-V2
4 バリエーション
DeepSeek-Coder-V2
4 バリエーション
DeepSeek-Prover
1 バリエーション
DeepSeek-V2.5
1 バリエーション
DeepSeek-V3
2 バリエーション
DeepSeek-R1
8 バリエーション
Janus
3 バリエーション
DeepSeek-R1-0528
1 バリエーション
DeepSeek-V3.1
1 バリエーション
DeepSeek-Prover-V2
2 バリエーション
DeepSeekMath-V2
1 バリエーション
DeepSeek-V3.2
1 バリエーション
家系図
現在のモデル: DeepSeek-VL2