Pixtral Large

ベースモデル
開発者
Mistral AI
ライセンス
Mistral Research License
リリース日
2024/11/18
コンテキスト長
128,000 トークン
対応言語
en, fr, de, es, it
知識カットオフ
2024-Q3
ベースモデル
mistral-large
officialmultimodalvisionfrontierdocument-understanding

Mistral AIのフロンティアクラスマルチモーダルモデル。2024年11月18日公開。Mistral Large 2ベース。テキスト123B+ビジョンエンコーダー1Bで合計124Bパラメータ。最大30枚の高解像度画像を同時処理。MathVista 69.4%でGPT-4o、Claude-3.5 Sonnetを超越。128Kコンテキスト。

ベンチマーク

mathvista
69.4

ソース: https://mistral.ai/news/pixtral-large

技術仕様

アーキテクチャ

Multimodal Transformer, 1B vision encoder, Document/Chart/Image understanding

パラメータバリエーション

Pixtral Large Instruct (2411)(124B)

HuggingFace

テキスト123B+ビジョン1B。MathVista、DocVQA、ChartQAでGPT-4o超。

MoEアクティブパラメータ: 124B
VRAM260GB

GGUFファイルは登録されていません

家系図

現在のモデル: Pixtral Large