最后更新:2025年12月31日 11:38
探索根据社区投票和性能指标排名的顶级AI模型
模型总数
22
数据库中可用
顶级模型
Anthropicclaude-opus-4-5-20251101-thinking-32k
排名第一
最高分
1493
最高评分
| # | 模型 | 评分 | 投票数 | 置信区间 | 组织 |
|---|---|---|---|---|---|
| 🥇 | Anthropicclaude-opus-4-5-20251101-thinking-32k | 1493.00 | 1,109 | ±20 | Anthropic |
| 🥈 | Anthropicclaude-opus-4-5-20251101 | 1479.00 | 1,421 | ±17 | Anthropic |
| 🥉 | gemini-3-pro | 1473.00 | 6,037 | ±11 | |
| 4 | gpt-5-medium | 1399.00 | 3,937 | ±12 | OpenAI |
| 5 | Anthropicclaude-sonnet-4-5-20250929-thinking-32k | 1397.00 | 5,376 | ±10 | Anthropic |
| 6 | gpt-5.1-medium | 1395.00 | 2,431 | ±13 | OpenAI |
| 7 | Anthropicclaude-opus-4-1-20250805 | 1393.00 | 5,204 | ±10 | Anthropic |
| 8 | Anthropicclaude-sonnet-4-5-20250929 | 1387.00 | 6,422 | ±10 | Anthropic |
| 9 | glm-4.6 | 1370.00 | 5,035 | ±11 | Z.ai |
| 10 | MoonshotAIkimi-k2-thinking-turbo | 1358.00 | 4,258 | ±11 | Moonshot |
| 11 | gpt-5.1 | 1358.00 | 4,484 | ±11 | OpenAI |
| 12 | gpt-5.1-codex | 1340.00 | 2,793 | ±12 | OpenAI |
| 13 | Minimaxminimax-m2 | 1321.00 | 4,956 | ±11 | MiniMax |
| 14 | deepseek-v3.2-exp | 1294.00 | 4,650 | ±11 | DeepSeek A |
| 15 | qwen3-coder-480b-a35b-instruct | 1293.00 | 5,159 | ±11 | Alibaba |
| 16 | Anthropicclaude-haiku-4-5-20251001 | 1289.00 | 5,158 | ±10 | Anthropic |
| 17 | gpt-5.1-codex-mini | 1253.00 | 1,563 | ±16 | OpenAI |
| 18 | grok-4-1-fast-reasoning | 1228.00 | 1,534 | ±17 | xAI |
| 19 | gemini-2.5-pro | 1211.00 | 3,503 | ±12 | |
| 20 | grok-4.1-thinking | 1207.00 | 1,253 | ±19 | xAI |
| 21 | grok-code-fast-1 | 1124.00 | 727 | ±24 | xAI |
| 22 | grok-4-fast-reasoning | 1120.00 | 530 | ±29 | xAI |
数据每小时更新 • 显示 22 个模型
数据来源:LM BASE 排行榜