Swallow (Llama 3.1)

ファインチューニング
開発者
東京工業大学 / 産総研
ライセンス
Llama 3.1 Community License
リリース日
2024/8/1
コンテキスト長
128,000 トークン
対応言語
ja, en
ベースモデル
meta-llama/Llama-3.1-8B
japanesemultilinguallong-context

Llama 3.1をベースにした日本語特化モデル。128Kコンテキスト対応。

技術仕様

アーキテクチャ

Transformer with GQA

プロンプトテンプレート

フォーマット: llama-3
システムプロンプト:
<|start_header_id|>system<|end_header_id|>

{system}<|eot_id|>
ユーザープロンプト:
<|start_header_id|>user<|end_header_id|>

{prompt}<|eot_id|>
アシスタントプロンプト:
<|start_header_id|>assistant<|end_header_id|>

ストップトークン:
<|eot_id|><|end_of_text|>

パラメータバリエーション

Swallow 8B(8B)

HuggingFace

Llama 3.1 8Bベースの日本語特化モデル。128Kコンテキスト対応。

VRAM6GB
RAM16GB

GGUFファイルは登録されていません

Swallow 70B(70B)

HuggingFace

Llama 3.1 70Bベースの日本語特化モデル。128Kコンテキスト対応。

VRAM40GB
RAM140GB

GGUFファイルは登録されていません

家系図

現在のモデル: Swallow (Llama 3.1)