Step Voice Generation Model Secures First Place in Domestic and Third Place Globally on the AA Leaderboard Voice Arena.

Leiphone

雷锋网

May 9, 2026, 03:18 AM

5 月 9 日，全球权威 TTS 评测榜单 Artificial Analysis Speech Arena Leaderboard 更新，阶跃语音生成模型 StepAudio 2.5 TTS 跻身全球前三，成为当前榜单排名最高的中国大模型。不同于传统实验室指标，该榜单采用盲测 Elo 评分机制，由用户在不知道模型身份的情况下，直接对同一文本生成的两段语音进行听感判断，测试覆盖客户服务、知识分享、数字助手、娱乐等真实应用场景。这意味着，StepAudio 2.5 TTS 的领先并不只是参数或指标上的提升，而是在真实用户听感中展现出更自然、更接近真人表达的能力，在实际落地中具备更强竞争力。据了解，阶跃近期集中发布 StepAudio 2.5 系列模型，包括 TTS、ASR 和 Realtime 三款模型，覆盖语音生成、语音识别与实时语音交互全链路。其中，StepAudio 2.5 TTS 面向高自然度语音生成，StepAudio 2.5 ASR 主打高速高精度识别，就在昨日 StepAudio 2.5 Realtime 也火速上线，聚焦打造更有“活人感”的 AI 聊天搭子，具备顶级