词元调用量激增意味着人工智能高质量数据供给体系正在形成

中国国家数据局局长刘烈宏指出,日均140万亿次词元调用量的大幅增长,表明了我国数据要素市场化配置改革的显著成效,也意味着人工智能高质量数据供给体系正在形成。尽管词元这个概念听起来很专业,但它其实是AI处理信息的基本单元,就像人类读写中的“字”一样。每一次你跟AI互动,无论是提问还是生成内容,都伴随着词元的调用。今年3月,中国日均词元调用量突破了140万亿次,这个数字从2024年初的1000亿次一路攀升到了现在。短短两年间,增长了超千倍,不仅展现了技术发展的速度,也映射出中国人工智能产业的勃勃生机。这种快速增长不仅体现了技术应用的普及程度,更是商业化进程中的重要信号。每一次调用都需要算力、算法和电力的支持。 刘烈宏提到,截至2025年底,我国已经建成了超过10万个高质量数据集,总体量超过了890PB。这些数据通过拆解成词元被AI处理应用,转化为生产力。有了海量高质量数据的支持,人工智能模型就能不断迭代优化。这就是“数据供给—价值释放”的良性循环。刘烈宏认为,这意味着数据要素价值正在加速释放。 在商业化方面,词元调用量激增意味着算力、算法和电力成本都在下降。随着技术成熟和生态完善,企业和用户开始信任并依赖AI技术。无论是教师备课、农民诊断病虫害、小微企业优化供应链还是普通用户处理文案图片,AI的应用场景越来越广。这种信任和依赖背后是用户体验的提升和效率的提高。 把复杂信息拆解成可操作的词元是AI处理数据的核心步骤。一个词元可以是单个汉字、标点符号或者一个词语片段。通过这种方式,AI能够把海量信息转化为有用的内容供人们使用。随着应用场景不断拓展和功能日益强大,人们的生活与工作方式正在发生改变。 这种变化让AI的按词元计费模式成为可能。因为词元具有可计量、可定价、可交易的特性,所以它被视为智能时代的“价值锚点”。通过这个指标来衡量各环节成本与效率竞争力已经成为行业共识。 词元的广泛使用让中国人工智能产业实现了跃迁新图景。在未来几年里(2025年以后),我们可以期待看到更多更精彩的变化。