DeepSeek-VL

ファインチューニング
開発者
DeepSeek AI
ライセンス
DeepSeek Model License
リリース日
2024/3/11
対応言語
en, zh
知識カットオフ
2024-Q1
ベースモデル
deepseek-llm
officialvisionmultimodalimage-understanding

DeepSeek AIのVision-Languageモデル。2024年3月11日公開。最大1024x1024ピクセルの画像入力に対応。1.3Bと7Bの2サイズ展開。画像理解、OCR、視覚的質問応答などのマルチモーダルタスクに対応。

技術仕様

アーキテクチャ

Vision-Language, Max 1024x1024 pixel input

パラメータバリエーション

DeepSeek-VL 1.3B(1.3B)

HuggingFace

1.3B軽量版。モバイル・エッジ向けVLM。

VRAM4GB

GGUFファイルは登録されていません

DeepSeek-VL 7B(7B)

HuggingFace

7Bフルサイズ版。高品質な画像理解。

VRAM17GB

GGUFファイルは登録されていません

家系図

現在のモデル: DeepSeek-VL