AI 模型能力排行

按编程 / 综合 / 图像 / 视频 / 搜索 / 音乐六个维度看主流模型排名

编程

基于人类盲测对战和标准化基准的编程能力合成评分

最近一次更新于 9天前

关于此工具

AI 模型能力排行展示主流模型在编程、综合（免费）、图像生成、视频生成、AI 搜索、音乐生成六个维度的排名。评分综合了人类盲测对战与标准化基准。

每个类目默认显示 Top 10，可展开查看全部。数据每周自动同步。

输入

选择：编程

输出

🥇 Claude Code  (Anthropic)
🥈 Codex        (OpenAI)
🥉 Gemini       (Google)
4  Kimi         (Moonshot)

常见问题

排名数据从哪儿来？

来自人类盲测对战投票（LMArena）与标准化基准评分（Artificial Analysis）的合成，更偏重人类偏好信号。每周自动同步一次。

能点进某个模型看详情吗？

v1.5 不做。本页面定位是快速扫读。看模型详情建议直接访问厂商页面。

为什么是这六个类目？

覆盖了当下选 AI 工具最常见的几个场景：写代码、日常对话、生成图像/视频、搜索网络、做音乐。其他能力（如表格、机器人）可能在后续版本加入。