Pixtral Large
ベースモデルofficialmultimodalvisionfrontierdocument-understanding
Mistral AIのフロンティアクラスマルチモーダルモデル。2024年11月18日公開。Mistral Large 2ベース。テキスト123B+ビジョンエンコーダー1Bで合計124Bパラメータ。最大30枚の高解像度画像を同時処理。MathVista 69.4%でGPT-4o、Claude-3.5 Sonnetを超越。128Kコンテキスト。
ベンチマーク
mathvista
69.4
ソース: https://mistral.ai/news/pixtral-large
技術仕様
アーキテクチャ
Multimodal Transformer, 1B vision encoder, Document/Chart/Image understanding
パラメータバリエーション
Pixtral Large Instruct (2411)(124B)
HuggingFaceテキスト123B+ビジョン1B。MathVista、DocVQA、ChartQAでGPT-4o超。
MoEアクティブパラメータ: 124B
VRAM260GB
GGUFファイルは登録されていません
関連モデル
Mistral 7B
6 バリエーション
Mixtral 8x7B
2 バリエーション
Mixtral 8x22B
2 バリエーション
Mistral Large
2 バリエーション
Mistral Small
4 バリエーション
Mistral Medium 3
2 バリエーション
Codestral
3 バリエーション
Codestral Mamba
1 バリエーション
Mathstral
1 バリエーション
Mistral NeMo
2 バリエーション
Pixtral 12B
1 バリエーション
Ministral
2 バリエーション
Mistral Saba
1 バリエーション
Magistral
2 バリエーション
Voxtral
2 バリエーション
Devstral
4 バリエーション
Mistral Large 3
6 バリエーション
家系図
現在のモデル: Pixtral Large