dayuyan

大语言模型综合能力排名
(截至2025年5月6日)

LiveBench 大语言模型测试排名
1 o3 High
2 o3 Medium
3 o4-Mini High
4 Gemini 2.5 Pro Preview
5 Claude 3.7 Sonnet Thinking
6 o4-Mini Medium
7 Qwen 3 235B A22B
8 DeepSeek R1
9 Qwen 3 32B
10 Grok 3 Mini Beta (High)

11 Gemini 2.5 Flash Preview
12 QwQ 32B
13 GPT-4.5 Preview
14 Qwen 3 30B A3B
15 Claude 3.7 Sonnet
16 Grok 3 Beta
17 GPT-4.1
18 DeepSeek V3 0324
19 ChatGPT-4o
20 Gemini 2.0 Flash


大模型竞技场排名:
1 Gemini-2.5-Pro-Exp-03-25
2 o3-2025-04-16
3 ChatGPT-4o-latest (2025-03-26)
4 Grok-3-Preview-02-24
5 Gemini-2.5-Flash-Preview-04-17
6 GPT-4.5-Preview
7 Gemini-2.0-Flash-Thinking-Exp-01-21
8 DeepSeek-V3-0324
9 GPT-4.1-2025-04-14
10 DeepSeek-R1

11 o4-mini-2025-04-16
12 Gemini-2.0-Flash-001
13 o1-2024-12-17
14 Qwen3-235B-A22B
15 Gemma-3-27B-it
16 Qwen2.5-Max
17 o1-preview
18 o3-mini-high
19 GPT-4.1-mini-2025-04-14
20 Gemma-3-12B-it


OpenAI公司推出的大语言模型:
ChatGPT-4o
o3系列
o1系列
o4系列
ChatGPT-4.1
GPT-4.5 Preview

谷歌公司推出的大语言模型:
Gemini 2.5 Pro Preview
Gemini 2.5 Flash Preview
Gemini 2.0 Flash
Gemma-3-27B

杭州深度求索人工智能基础技术研究有限公司推出的大语言模型:
DeepSeek V3 0324
DeepSeek R1

xAI公司推出的大语言模型:
Grok-3
Grok-3 mini

Anthropic公司推出的大语言模型:
Claude 3.7 Sonnet Thinking
Claude 3.7 Sonnet
Claude 3.5 Sonnet

阿里巴巴公司推出的大语言模型:
Qwen 3 235B A22B
QwQ 32B
Qwen 3 30B A3B
Qwen2.5 Max

Meta公司(旗下有Facebook,INS等)推出的大语言模型:
Llama 4 Maverick
Llama 4 Scout

腾讯公司推出的大语言模型:
Hunyuan Turbos