按编程 / 综合 / 图像 / 视频 / 搜索 / 音乐 六个维度看主流模型排名
基于人类盲测对战和标准化基准的编程能力合成评分
| # | 模型 | 厂商 | 评分 |
|---|---|---|---|
| 🥇 | Claude Code | Anthropic | 4.6 |
| 🥈 | Codex | OpenAI | 4.4 |
| 🥉 | Gemini | 4.4 | |
| 4 | Kimi | Moonshot | 4.3 |
| 5 | Minimax | MiniMax | 3.5 |
AI 模型能力排行展示主流模型在编程、综合(免费)、图像生成、视频生成、AI 搜索、音乐生成六个维度的排名。评分综合了人类盲测对战与标准化基准。
每个类目默认显示 Top 10,可展开查看全部。数据每周自动同步。
选择:编程🥇 Claude Code (Anthropic)
🥈 Codex (OpenAI)
🥉 Gemini (Google)
4 Kimi (Moonshot)来自人类盲测对战投票(LMArena)与标准化基准评分(Artificial Analysis)的合成,更偏重人类偏好信号。每周自动同步一次。
v1.5 不做。本页面定位是快速扫读。看模型详情建议直接访问厂商页面。
覆盖了当下选 AI 工具最常见的几个场景:写代码、日常对话、生成图像/视频、搜索网络、做音乐。其他能力(如表格、机器人)可能在后续版本加入。