dayuyan

大语言模型综合能力排名
(截至2025年5月7日)

LiveBench 大语言模型测试排名
1 o3 High
2 o3 Medium
3 Gemini 2.5 Pro Preview (2025-05-06)
4 o4-Mini High
5 Gemini 2.5 Pro Preview (2025-03-25)
6 Claude 3.7 Sonnet Thinking
7 o4-Mini Medium
8 Qwen 3 235B A22B
9 DeepSeek R1
10 Qwen 3 32B

11 Grok 3 Mini Beta (High)
12 Gemini 2.5 Flash Preview
13 QwQ 32B
14 GPT-4.5 Preview
15 Qwen 3 30B A3B
16 Claude 3.7 Sonnet
17 Grok 3 Beta
18 GPT-4.1
19 DeepSeek V3 0324
20 ChatGPT-4o


大模型竞技场排名:
1 Gemini-2.5-Pro-Preview-05-06
2 o3-2025-04-16
3 ChatGPT-4o-latest (2025-03-26)
4 Grok-3-Preview-02-24
5 GPT-4.5-Preview
6 Gemini-2.5-Flash-Preview-04-17
7 DeepSeek-V3-0324
8 GPT-4.1-2025-04-14
9 DeepSeek-R1
10 o4-mini-2025-04-16

11 Gemini-2.0-Flash-001
12 o1-2024-12-17
13 Qwen3-235B-A22B
14 Gemma-3-27B-it
15 Qwen2.5-Max
16 o1-preview
17 o3-mini-high
18 GPT-4.1-mini-2025-04-14
19 Gemma-3-12B-it
20 DeepSeek-V3


OpenAI公司推出的大语言模型:
ChatGPT-4o
o3系列
o1系列
o4系列
ChatGPT-4.1
GPT-4.5 Preview

谷歌公司推出的大语言模型:
Gemini 2.5 Pro Preview
Gemini 2.5 Flash Preview
Gemini 2.0 Flash
Gemma-3-27B

杭州深度求索人工智能基础技术研究有限公司推出的大语言模型:
DeepSeek V3 0324
DeepSeek R1

xAI公司推出的大语言模型:
Grok-3
Grok-3 mini

Anthropic公司推出的大语言模型:
Claude 3.7 Sonnet Thinking
Claude 3.7 Sonnet
Claude 3.5 Sonnet

阿里巴巴公司推出的大语言模型:
Qwen 3 235B A22B
QwQ 32B
Qwen 3 30B A3B
Qwen2.5 Max

Meta公司(旗下有Facebook,INS等)推出的大语言模型:
Llama 4 Maverick
Llama 4 Scout

腾讯公司推出的大语言模型:
Hunyuan Turbos