Phi-4

ベースモデル
開発者
Microsoft Research
ライセンス
MIT
リリース日
2024/12/12
コンテキスト長
16,000 トークン
トレーニングトークン
9.8T
対応言語
en
知識カットオフ
2024-06
ベースモデル
phi-3-5
officialtext-generationreasoningmathefficientopen-source

2024年12月公開。推論・数学特化モデル。14Bパラメータ。9.8兆トークン学習。GPT-4o生成の高品質合成データ使用。MMLU 84.8%、MATH 80.4%、HumanEval 82.6%達成。Gemini Pro 1.5を数学競技問題で上回り、GPT-4oを一部推論タスクで上回る。単一GPUまたはNPUラップトップで実行可能。

ベンチマーク

MMLU
84.8
HumanEval
82.6
MATH
80.4
GPQA
56.1

ソース: https://arxiv.org/abs/2412.08905

技術仕様

アーキテクチャ

Dense decoder-only Transformer, SFT + iterative DPO, Math reasoning specialized

パラメータバリエーション

Phi-4(14B)

HuggingFace

14Bで5倍大きなモデルを数学・推論で上回る。2〜4倍高速推論。

VRAM30GB

GGUFファイルは登録されていません

家系図

現在のモデル: Phi-4