京东欲打造全球最大的数据采集中心

京东打算把自家的业务场景利用起来,搞个全球最大的数据采集中心,目标是给具身智能产业把万亿的盘子搭起来。现在这行当跑得挺快,但也有硬茬子要啃:机器人动作上的“小脑”是练出来了,可做决策的“大脑”——具身大模型,因为没什么真东西练手,训练老是跟不上,这就让技术落地这块儿变得难搞。为了把这事整活,京东就靠着手里这一堆上下游的资源,还有做零售、物流、外卖这些活儿时攒下的海量真实场景,准备把最大最全的数据中心给建起来。到时候两年里头能攒够1000万小时的优质数据,帮着大家伙儿把算法仿真这种事甩到后面去,变成靠真金白银的数据来驱动。 大家都知道AI现在是个集大成的东西,具身智能更是个万亿级的蓝海市场。没数据这个燃料是不行的。京东之前也搞过几个采集中心了,现在是构建了一整套从采集到标注、训练再到验证的流水线。这块儿他们也不算新手了。除了物流仓储这些地方,健康医疗、家庭服务、城市运维这五个地方的视觉、触觉和空间轨迹数据都在记着呢。 更狠的是,京东打算发动几十万人一起去搞数据采集。这其中有超过10万名内部的员工参与进来。外部还有最多50万的各行各业人员在行动。单单在宿迁一个地方,就要发动超过10万的市民加入进来。从家里、办公室到工厂、物流仓库、商店、餐厅、医院、环卫这些场景全都要覆盖到。 为了保证数据的合规性,京东在整个过程中肯定会严格按照法律来办事儿。有了这些措施后,京东准备在一年之内凑齐500万小时人类真实场景的视频数据。两年内把这个数字推到1000万小时以上,同时把本体机器人的数据也同步攒够100万小时。等这事儿办成了,他们就成了全球最大的具身智能数据公司了。这样就能从根子上解决行业里的“数据荒”问题。 只要让“大脑”和“小脑”好好配合进化一下,京东就能帮忙让具身模型不光会“看”和“动”,还能真正理解真实世界到底是个啥样子。