LLM Leaderboard Pareto Analysis

Pareto 前沿模型（综合能力从高到低）

#	模型	综合能力	单次价格 (USD)	归一化价格	推理
1	Claude Opus 4.8 (max)	0.8866	$0.6929	1.0000	Y
2	Gemini 3.5 Flash	0.8332	$0.6290	0.9077	Y
3	GPT-5.5 (medium)	0.8199	$0.4808	0.6939	Y
4	Grok 4.3 (high)	0.7372	$0.3697	0.5335	Y
5	DeepSeek V4 Pro (Max)	0.7335	$0.2139	0.3086	Y
6	DeepSeek V4 Pro (High)	0.7159	$0.1092	0.1576	Y
7	MiMo-V2.5	0.6916	$0.0353	0.0510	Y
8	Qwen3.5 397B A17B	0.6364	$0.0329	0.0475	Y
9	GPT-5.4 nano (xhigh)	0.6265	$0.0259	0.0374	Y
10	Qwen3.6 35B A3B	0.6164	$0.0095	0.0138	Y
11	Qwen3.5 Omni Plus	0.5565	$0.0042	0.0061	N
12	Qwen3.5 122B A10B	0.5086	$0.0034	0.0049	N
13	Qwen3.5 9B	0.4811	$0.0014	0.0020	Y
14	Gemma 4 31B	0.4566	$0.0007	0.0010	N
15	MiMo-V2-Flash	0.3867	$0.0006	0.0009	N
16	Qwen3.5 4B	0.3116	$0.0002	0.0003	N
17	Qwen3.5 2B	0.1850	$0.0001	0.0002	N

评分方法

15项Intelligence子指标各自线性归一化到 [0,1]
综合能力值 = 所有有效归一化分数的算术平均
Pareto前沿 = 不被任何其他模型支配的模型

坐标说明

X轴（线性归一化价格）：

归一化基准 = 帕累托前沿中最贵模型的单次请求价格
归一化价格 = 单次请求价格 / 基准价格
0 = 免费，1 = 最贵的帕累托前沿模型
超出 [0,1] 范围的模型不在图中显示

Y轴（综合能力）：

15项Intelligence子指标各自归一化到 [0,1]
综合能力 = 所有有效归一化分数的算术平均（已在 [0,1] 范围内）
0 = 最低，1 = 最高

精确分数计算

全程使用 Python fractions.Fraction 进行精确有理数运算：

所有解析值、归一化、均值、比值、价格计算均使用精确分数
仅在绘图坐标传入 matplotlib 及 JSON 序列化时转为浮点数

单次请求价格计算

输入输出比 r = (Blended - Output_Price) / (Input_Price - Output_Price)
非推理/推理有ReasonT: 输出tokens = (Total_Response - TTFT) × Speed
推理无ReasonT: 输出tokens = Total_Response × Speed
输入tokens = 输出tokens × r / (1-r)
单次价格 = (输入tokens × Input_Price + 输出tokens × Output_Price) / 1,000,000

数据来源: Artificial Analysis
模型总数: 142

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
.github/workflows		.github/workflows
output		output
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Leaderboard Pareto Analysis

Pareto 前沿模型（综合能力从高到低）

评分方法

坐标说明

精确分数计算

单次请求价格计算

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LLM Leaderboard Pareto Analysis

Pareto 前沿模型（综合能力从高到低）

评分方法

坐标说明

精确分数计算

单次请求价格计算

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages