阶跃星辰开源语音模型登顶全球权威评测榜

当前，语音交互已成为人工智能应用的重要方向，但要让机器像人类一样“听完就能思考”仍然不容易。阶跃星辰最新发布的Step-Audio-R1.1模型在此方向取得进展：在国际评测机构Artificial Analysis Speech Reasoning的最新排名中位居榜首，显示原生语音推理技术正进入新的发展阶段。该榜单是业内评估原生语音模型的重要第三方基准之一，主要关注准确率、首包延迟等关键指标。不同于传统“语音识别+文本处理”的路径，原生语音模型可直接处理音频信号并完成复杂推理，无需经过文本转换的中间环节。Step-Audio-R1.1以96.4%的准确率领先，超过Grok、Gemini、GPT-Realtime等模型，并刷新了该评测体系的最佳纪录。

从“能听见”到“能听懂并推理”，语音交互正在发生关键跃迁；此次排名变化与开源动作，说明了行业对实时性与推理能力的集中投入。下一步，能否在真实场景中同时兼顾体验、成本与安全，将决定谁能把技术领先转化为稳定的产业价值，让更自然、更普惠的人机交互真正走进日常。