LMArena.ai 全球 AI 模型盲测对战与排行榜使用指南

LMArena.ai 平台简介

LMArena 是由加州大学伯克利分校研究人员开发的开放平台，旨在让公众轻松访问、探索并与全球领先的 AI 模型互动。该平台汇聚了包括 GPT-5、Gemini、Claude 在内的 300 余款主流模型，通过社区投票机制构建公开排行榜，使 AI 发展更加透明。

平台主要提供三种交互模式，满足不同场景下的模型体验需求。

这是平台最具特色的功能，类似'蒙面歌王'。系统会匿名配对两款模型，用户输入提示词后，双方分别生成回答。用户需在不知晓模型身份的情况下进行投票，选择'左边更好'、'平局'、'都不好'或'右边更好'。投票结果直接影响模型的 Elo 评分排名，确保公平性。

盲测对战流程

投票完成后，系统才会揭晓两个模型的具体名称。

揭晓模型名称

如果希望明确指定模型进行比较，可以使用此模式。用户可以自主选择两款特定模型，输入相同的需求进行对比，并同样支持投票反馈。

模型对比界面

适用于单模型深度测试。一次仅与一个模型对话，无投票环节，适合专注于特定模型能力的验证。

直接对话界面

基于用户的投票数据，平台在不同领域生成了详细的排名表现，涵盖文本生成、视觉理解、搜索能力、图片编辑及视频生成等方向。这些数据反映了当前社区对模型真实能力的共识。

排行榜概览

细分领域排行