300 个模型按新闻排名。 评分包含以下额外加分: 网页搜索, large context (source analysis), large output (long-form articles), 流式输出和reasoning.
| # | 模型 | 评分 |
|---|---|---|
| 1 | GPT-5.4 ProOpenAI | 94 |
| 2 | GPT-5.4OpenAI | 94 |
| 3 | GPT-5.4 MiniOpenAI | 93 |
| 4 | GPT-5.2 ProOpenAI | 93 |
| 5 | GPT-5.2OpenAI | 93 |
| 6 | Claude Opus 4.6Anthropic | 92 |
| 7 | GPT-5 ProOpenAI | 92 |
| 8 | o3 Deep ResearchOpenAI | 92 |
| 9 | Claude Opus 4.5Anthropic | 90 |
| 10 | GPT-5OpenAI | 90 |
| 11 | Claude Sonnet 4.6Anthropic | 89 |
| 12 | Claude Sonnet 4.5Anthropic | 89 |
| 13 | o3 ProOpenAI | 88 |
| 14 | Grok 4.1 FastxAI | 87 |
| 15 | o3OpenAI | 86 |
| 16 | GPT-5.1OpenAI | 85 |
| 17 | GPT-5.4 NanoOpenAI | 85 |
| 18 | GPT-5.3-CodexOpenAI | 85 |
| 19 | GPT-5.2-CodexOpenAI | 85 |
| 20 | GPT-5.1-Codex-MaxOpenAI | 85 |
| 21 | o4 Mini Deep ResearchOpenAI | 85 |
| 22 | o4 Mini HighOpenAI | 85 |
| 23 | o4 MiniOpenAI | 84 |
| 24 | Grok 4 FastxAI | 83 |
| 25 | GPT-5.3 ChatOpenAI | 85 |
| 26 | GPT-5.1 ChatOpenAI | 85 |
| 27 | Claude Haiku 4.5Anthropic | 83 |
| 28 | Grok 4xAI | 86 |
| 29 | Grok 4.20 BetaxAI | 86 |
| 30 | Gemini 3 Pro PreviewGoogle | 90 |
网页搜索模型实时与多个来源交叉引用说法。推理模型评估矛盾信息并识别潜在的虚假信息模式。
大上下文窗口处理完整的法庭文件、财务报告和政府文件。网页搜索获取当前上下文以补充已有知识。
大输出模型生成长篇调查报道、专题文章和连载系列。流式传输为时效驱动的新闻编辑室提供实时草稿。
模型分析数据集、发现趋势并生成数据驱动的报道角度。JSON模式输出与可视化工具和CMS平台集成的结构化发现。
根据我们每小时更新的综合评分,本页顶部显示了排名靠前的模型。排名综合考虑了基准测试、定价、功能和社区采用情况。
是的,本页列出的几款模型提供免费套餐或完全开源。请查看上方定价列中标记为免费的模型。
我们使用综合评分系统,结合基准性能、功能匹配、定价、上下文窗口大小和社区采用情况。评分每小时更新一次。
排名每小时使用基准测试、API测试和社区指标的实时数据刷新。显示的数据始终反映最新的性能。