DeepSeek-VL
ファインチューニングofficialvisionmultimodalimage-understanding
DeepSeek AIのVision-Languageモデル。2024年3月11日公開。最大1024x1024ピクセルの画像入力に対応。1.3Bと7Bの2サイズ展開。画像理解、OCR、視覚的質問応答などのマルチモーダルタスクに対応。
技術仕様
アーキテクチャ
Vision-Language, Max 1024x1024 pixel input
パラメータバリエーション
関連モデル
DeepSeek-LLM
4 バリエーション
DeepSeek-Coder
7 バリエーション
DeepSeekMoE
2 バリエーション
DeepSeek-Math
3 バリエーション
DeepSeek-V2
4 バリエーション
DeepSeek-Coder-V2
4 バリエーション
DeepSeek-Prover
1 バリエーション
DeepSeek-V2.5
1 バリエーション
DeepSeek-V3
2 バリエーション
DeepSeek-VL2
3 バリエーション
DeepSeek-R1
8 バリエーション
Janus
3 バリエーション
DeepSeek-R1-0528
1 バリエーション
DeepSeek-V3.1
1 バリエーション
DeepSeek-Prover-V2
2 バリエーション
DeepSeekMath-V2
1 バリエーション
DeepSeek-V3.2
1 バリエーション
家系図
現在のモデル: DeepSeek-VL