阶跃星辰开源语音模型登顶全球权威评测榜

当前,语音交互已成为人工智能应用的重要方向,但要让机器像人类一样“听完就能思考”仍然不容易。阶跃星辰最新发布的Step-Audio-R1.1模型在此方向取得进展:在国际评测机构Artificial Analysis Speech Reasoning的最新排名中位居榜首,显示原生语音推理技术正进入新的发展阶段。该榜单是业内评估原生语音模型的重要第三方基准之一,主要关注准确率、首包延迟等关键指标。不同于传统“语音识别+文本处理”的路径,原生语音模型可直接处理音频信号并完成复杂推理,无需经过文本转换的中间环节。Step-Audio-R1.1以96.4%的准确率领先,超过Grok、Gemini、GPT-Realtime等模型,并刷新了该评测体系的最佳纪录。

从“能听见”到“能听懂并推理”,语音交互正在发生关键跃迁;此次排名变化与开源动作,说明了行业对实时性与推理能力的集中投入。下一步,能否在真实场景中同时兼顾体验、成本与安全,将决定谁能把技术领先转化为稳定的产业价值,让更自然、更普惠的人机交互真正走进日常。