ChatGLM-6B
指示チューニングofficialbilingualdialogue
コンシューマー向けGPUで動作可能な初のGLM対話モデル。INT4量子化で6GB VRAMで推論可能。中国語・英語のバイリンガル対応。GLM-130Bの技術を小型化し、ローカル実行を実現。
ベンチマーク
MMLU
25.2
ソース: ChatGLM Technical Report
技術仕様
アーキテクチャ
GLM Transformer
プロンプトテンプレート
フォーマット: chatglm
ユーザープロンプト:
[Round {n}]
问:{prompt}
アシスタントプロンプト:
答:
ストップトークン:
</s>パラメータバリエーション
VisualGLM-6B(6B)
HuggingFaceGLMファミリー初のマルチモーダルモデル。ChatGLM-6BにBLIP2-Qformer画像エンコーダを統合。
VRAM15GB
RAM20GB
GGUFファイルは登録されていません
関連モデル
家系図
現在のモデル: ChatGLM-6B