京东欲打造全球最大的数据采集中心

京东打算把自家的业务场景利用起来，搞个全球最大的数据采集中心，目标是给具身智能产业把万亿的盘子搭起来。现在这行当跑得挺快，但也有硬茬子要啃：机器人动作上的“小脑”是练出来了，可做决策的“大脑”——具身大模型，因为没什么真东西练手，训练老是跟不上，这就让技术落地这块儿变得难搞。为了把这事整活，京东就靠着手里这一堆上下游的资源，还有做零售、物流、外卖这些活儿时攒下的海量真实场景，准备把最大最全的数据中心给建起来。到时候两年里头能攒够1000万小时的优质数据，帮着大家伙儿把算法仿真这种事甩到后面去，变成靠真金白银的数据来驱动。大家都知道AI现在是个集大成的东西，具身智能更是个万亿级的蓝海市场。没数据这个燃料是不行的。京东之前也搞过几个采集中心了，现在是构建了一整套从采集到标注、训练再到验证的流水线。这块儿他们也不算新手了。除了物流仓储这些地方，健康医疗、家庭服务、城市运维这五个地方的视觉、触觉和空间轨迹数据都在记着呢。更狠的是，京东打算发动几十万人一起去搞数据采集。这其中有超过10万名内部的员工参与进来。外部还有最多50万的各行各业人员在行动。单单在宿迁一个地方，就要发动超过10万的市民加入进来。从家里、办公室到工厂、物流仓库、商店、餐厅、医院、环卫这些场景全都要覆盖到。为了保证数据的合规性，京东在整个过程中肯定会严格按照法律来办事儿。有了这些措施后，京东准备在一年之内凑齐500万小时人类真实场景的视频数据。两年内把这个数字推到1000万小时以上，同时把本体机器人的数据也同步攒够100万小时。等这事儿办成了，他们就成了全球最大的具身智能数据公司了。这样就能从根子上解决行业里的“数据荒”问题。只要让“大脑”和“小脑”好好配合进化一下，京东就能帮忙让具身模型不光会“看”和“动”，还能真正理解真实世界到底是个啥样子。