| # | 模型 | 综合能力 | 单次价格 (USD) | 归一化价格 | 推理 |
|---|---|---|---|---|---|
| 1 | Claude Opus 4.8 (max) | 0.8866 | $0.6929 | 1.0000 | Y |
| 2 | Gemini 3.5 Flash | 0.8332 | $0.6290 | 0.9077 | Y |
| 3 | GPT-5.5 (medium) | 0.8199 | $0.4808 | 0.6939 | Y |
| 4 | Grok 4.3 (high) | 0.7372 | $0.3697 | 0.5335 | Y |
| 5 | DeepSeek V4 Pro (Max) | 0.7335 | $0.2139 | 0.3086 | Y |
| 6 | DeepSeek V4 Pro (High) | 0.7159 | $0.1092 | 0.1576 | Y |
| 7 | MiMo-V2.5 | 0.6916 | $0.0353 | 0.0510 | Y |
| 8 | Qwen3.5 397B A17B | 0.6364 | $0.0329 | 0.0475 | Y |
| 9 | GPT-5.4 nano (xhigh) | 0.6265 | $0.0259 | 0.0374 | Y |
| 10 | Qwen3.6 35B A3B | 0.6164 | $0.0095 | 0.0138 | Y |
| 11 | Qwen3.5 Omni Plus | 0.5565 | $0.0042 | 0.0061 | N |
| 12 | Qwen3.5 122B A10B | 0.5086 | $0.0034 | 0.0049 | N |
| 13 | Qwen3.5 9B | 0.4811 | $0.0014 | 0.0020 | Y |
| 14 | Gemma 4 31B | 0.4566 | $0.0007 | 0.0010 | N |
| 15 | MiMo-V2-Flash | 0.3867 | $0.0006 | 0.0009 | N |
| 16 | Qwen3.5 4B | 0.3116 | $0.0002 | 0.0003 | N |
| 17 | Qwen3.5 2B | 0.1850 | $0.0001 | 0.0002 | N |
- 15项Intelligence子指标各自线性归一化到 [0,1]
- 综合能力值 = 所有有效归一化分数的算术平均
- Pareto前沿 = 不被任何其他模型支配的模型
X轴(线性归一化价格):
- 归一化基准 = 帕累托前沿中最贵模型的单次请求价格
- 归一化价格 = 单次请求价格 / 基准价格
- 0 = 免费,1 = 最贵的帕累托前沿模型
- 超出 [0,1] 范围的模型不在图中显示
Y轴(综合能力):
- 15项Intelligence子指标各自归一化到 [0,1]
- 综合能力 = 所有有效归一化分数的算术平均(已在 [0,1] 范围内)
- 0 = 最低,1 = 最高
全程使用 Python fractions.Fraction 进行精确有理数运算:
- 所有解析值、归一化、均值、比值、价格计算均使用精确分数
- 仅在绘图坐标传入 matplotlib 及 JSON 序列化时转为浮点数
输入输出比 r = (Blended - Output_Price) / (Input_Price - Output_Price)
非推理/推理有ReasonT: 输出tokens = (Total_Response - TTFT) × Speed
推理无ReasonT: 输出tokens = Total_Response × Speed
输入tokens = 输出tokens × r / (1-r)
单次价格 = (输入tokens × Input_Price + 输出tokens × Output_Price) / 1,000,000
数据来源: Artificial Analysis
模型总数: 142
