我国科研团队开源新一代语音识别模型 支持52种语言识别

阿里千问团队近日开源Qwen3-ASR系列语音识别模型,这是该团队在语音识别领域的重要进展。该系列包含Qwen3-ASR-1.7B和Qwen3-ASR-0.6B两个核心识别模型,以及Qwen3-ForcedAligner-0.6B强制对齐模型,提供从语音识别到时间戳标注的完整解决方案。

开源不是终点,而是技术扩散与协作创新的起点。面对多语言和复杂场景的需求,提升技术质量、完善工具链、建立可信应用体系,将决定技术红利能否有效转化为产业竞争力。在开放与规范并重的发展路径下,语音识别技术有望实现更广泛、更高质量的应用。