最近咱们在上海搞了一场活动,叫开放原子园区行(上海站),就是想聊聊怎么把人工智能的开源生态搞得更深点。就在这个6月17日,三件大事干了起来,首先是成立了“开放原子开源基金会人工智能开源社区开源数据集工作组”,名字有点长,简称工作组吧。还有一个叫“具身智能开源数据集社区”的也给搭起来了。另外呢,OpenLET“触觉灵巧操作+全身运动”这个数据集,直接在AtomGit上给全球首发了。 这几个动作都挺新鲜,算是给咱们中国人工智能的数据生态又加了点料。你看工作组这块,主要是由开放原子开源基金会带头拉了一帮产业、科研还有搞标准的人凑一块儿。他们打算先定规矩再搞技术,系统性地把技术规范、安全合规这些事儿给建好,好解决以前行业标准不统一、大家不够配合的问题。 具身智能开源数据集社区呢,主要是盯着人形机器人这块的真实数据开源和生态建设。他们想通过共享数据和持续运营,把那些全尺寸人形机器人真机的数据和模型训练工具链都敞开了让开发者用,好孵化出新的创新团队,给全球的开发者、科研队还有企业搭个桥。 那个OpenLET数据集可是头一个在国内开源的全尺寸人形机器人全身协同多模态真机数据集,以前这块儿的空白算是给补上了。这次在AtomGit首发,有好多来自科研机构、龙头企业、高校专家和开发者代表都来了,大家一块儿琢磨数据怎么开放共享,还想把开源技术和人工智能的要素更深度地融合起来。 开放原子开源基金会的理事长程晓明也说了,现在中国高质量的开源数据集已经有了不少进步,不过在规模、质量还有多样性这些方面还是得再往上走走。这次搞这个活动就是要打牢数据的基础,也是基金会在深化人工智能生态建设上的一个重要举措。 说到这儿就得提提背景了,开放原子开源基金会是从2020年6月成立的。成立这五年半里头,他们给开源项目提供资金募集、运营孵化这些全方位服务。到现在已经孵化了52个项目,也聚集了好几百家伙伴和开发者。特别是和生态伙伴一起打造的AtomGit平台,那是真给力,直接推动了中国软件产业发展,给各行各业的数字化转型加了速。 上海这边的产业资源和应用场景那是相当丰富的,像人工智能、集成电路、智能制造这些领域都不错。上海市经济和信息化委员会的总工程师裘薇也提到了个事儿:2025年的时候上海已经实现了100万条高质量思维链数据的开源和OpenLoong社区超过10万条动作数据的开放。以后还打算在机制和人才方面多探索探索。 徐汇区是上海搞人工智能产业的核心区,正玩命想建成全国的高地呢。现在那儿聚集了不少优质企业和重点机构。到2025年,“开放原子上海开源促进中心”也落户徐汇区了。上海市徐汇区副区长陈勇说了,双方要一起搞各种活动把产业生态闭环给搭建起来。(完)