Phi-4

ベースモデル

開発者

Microsoft Research

ライセンス

MIT

リリース日

2024/12/12

コンテキスト長

16,000 トークン

トレーニングトークン

9.8T

対応言語

en

知識カットオフ

2024-06

ベースモデル

phi-3-5

officialtext-generationreasoningmathefficientopen-source

2024年12月公開。推論・数学特化モデル。14Bパラメータ。9.8兆トークン学習。GPT-4o生成の高品質合成データ使用。MMLU 84.8%、MATH 80.4%、HumanEval 82.6%達成。Gemini Pro 1.5を数学競技問題で上回り、GPT-4oを一部推論タスクで上回る。単一GPUまたはNPUラップトップで実行可能。

HuggingFace 論文公式サイト

ベンチマーク

MMLU

84.8

HumanEval

82.6

MATH

80.4

GPQA

56.1

ソース: https://arxiv.org/abs/2412.08905

技術仕様

アーキテクチャ

Dense decoder-only Transformer, SFT + iterative DPO, Math reasoning specialized

パラメータバリエーション

Phi-4(14B)

HuggingFace

14Bで5倍大きなモデルを数学・推論で上回る。2〜4倍高速推論。

VRAM8GB

GGUFファイルは登録されていません

家系図

現在のモデル: Phi-4

ベース

FT

派生

表示中

Phi-4

ベンチマーク

技術仕様

アーキテクチャ

パラメータバリエーション

Phi-4(14B)

関連モデル

Phi-1

Phi-2

Phi-3

Phi-3.5

Phi-4-mini

Phi-4-multimodal

Phi-4-reasoning

家系図