DeepSeek-VL

ファインチューニング

開発者

DeepSeek AI

ライセンス

DeepSeek Model License

リリース日

2024/3/11

コンテキスト長

4,096 トークン

対応言語

en, zh

知識カットオフ

2023

ベースモデル

deepseek-llm

officialvisionmultimodalimage-understanding

DeepSeek AIのVision-Languageモデル。2024年3月11日公開。7Bモデルは最大1024x1024ピクセル、1.3Bモデルは384x384ピクセルの画像入力に対応。1.3Bと7Bの2サイズ展開。画像理解、OCR、視覚的質問応答などのマルチモーダルタスクに対応。

HuggingFace 論文 GitHub

技術仕様

アーキテクチャ

Vision-Language, Max 1024x1024 pixel input

パラメータバリエーション

DeepSeek-VL 1.3B(1.3B)

HuggingFace

1.3B軽量版。モバイル・エッジ向けVLM。

VRAM1GB

GGUFファイルは登録されていません

DeepSeek-VL 7B(7B)

HuggingFace

7Bフルサイズ版。高品質な画像理解。

VRAM4GB

GGUFファイルは登録されていません

家系図

現在のモデル: DeepSeek-VL

ベース

FT

派生

表示中

DeepSeek-VL

技術仕様

アーキテクチャ

パラメータバリエーション

DeepSeek-VL 1.3B(1.3B)

DeepSeek-VL 7B(7B)

関連モデル

DeepSeek-LLM

DeepSeek-Coder

DeepSeekMoE

DeepSeek-Math

DeepSeek-V2

DeepSeek-Coder-V2

DeepSeek-Prover

DeepSeek-V2.5

DeepSeek-V3

DeepSeek-VL2

DeepSeek-R1

Janus

DeepSeek-R1-0528

DeepSeek-V3.1

DeepSeek-Prover-V2

DeepSeekMath-V2

DeepSeek-V3.2

家系図