天基超算已成为国际竞争新高地。近日,美国太空探索公司向联邦通信委员会提出最多发射100万颗卫星的计划,建立轨道数据中心系统,并收购人工智能初创企业。,中国的中科天算公司正加快步伐,推动天基超算从理论转化为现实应用。这家由中国科学院计算技术研究所孵化的企业,已研制出多卡全尺寸GPU架构的天基超算节点原型机,其计算能力相当于一个小型数据中心。获得上海未来产业基金投资后,中科天算将于今年下半年发射太空超算实验节点,计划2030年完成万卡级太空超算中心的在轨部署。 为什么必须将超算中心搬上太空?这源于卫星产业快速发展带来的现实挑战。随着卫星星座规模的扩大和遥感技术的升级,数据产生速度已远超地面处理能力。以卫星遥感为例,遥感影像的地面分辨率已达到0.1米,相比十年前的10米分辨率,数据量增长了近1万倍。然而,由于星地通信的带宽和时间窗口受限,卫星获取的海量数据中仅有不足5%能被传输回地面,即使传输回来也需要数天时间才能处理。这对森林火灾预警、重要目标识别等需要快速响应的应急任务来说,明显滞后且低效。在卫星通信领域,新兴的语义通信技术也对天基计算提出了更高要求。 天基超算的优势远不止于此。太空数据中心相比地面设施拥有独特的能源和散热优势。位于太阳同步轨道的太空数据中心可持续获得24小时不间断的太阳能供应,不受昼夜循环、天气和大气衰减的影响,接收的太阳辐射能量比地面高约40%,从而实现能源自给自足。这个点对于耗电量巨大的超算中心至关重要。同时,太空极低的温度环境——可低至零下270摄氏度——使数据中心的热量能以辐射方式快速散发,这种天然的散热条件是地面数据中心难以比拟的。 然而,将超算中心送上太空面临多个技术瓶颈。太空环境中的辐射强度远超地面,会对计算芯片的稳定运行造成严重干扰。由于太空难以实现人工维修,系统必须具备极强的自主容错与自愈能力。此外,太空的真空环境缺乏空气对流,为高热流密度的芯片设计高效、可靠的热控系统成为必须跨越的工程难题。 中科天算依托中国科学院计算所的技术积累,在这些关键领域取得突破。公司在器件、系统架构、操作系统和算法等不同层面建立了跨层协同容错机制,当辐射干扰导致部分计算或存储单元出错时,仍能保障整个计算系统的正确运行。在热控技术上,科研团队为高功率GPU等计算单元设计了封闭式流体回路散热结构,能将热量快速从计算核心转移到外部辐射板,有效破解了太空导热难题。这些技术方案已在实际项目中初步验证。2024年2月,中国科学院计算所的科研团队为"东方慧眼"高分01星研制了"极光1000·慧眼"星载智能计算机,该计算机采用国产芯片,建有系统级容错体系,可提供100 TOPS的算力,使卫星能够在轨处理海量遥感数据,无需将全部数据传回地面,大幅提高了数据处理效率和应急响应能力。 上海未来产业基金的投资支持,为中科天算的发展提供了重要保障。基金负责人表示,天基计算是未来空间与信息领域的关键前沿技术,将通过投资和孵化助力突破算力瓶颈,培育空天信息产业生态。这反映出国家层面对该产业的注重和战略支持。
把算力送上太空,表面看是一场技术跃迁,本质上是空天信息从“数据回传”走向“在轨智能”的范式变革。能否把极端环境下的稳定计算做成可复制、可扩展的基础设施,将检验创新体系与工程能力的深度。面向新一轮产业竞争,尽早完成关键技术在轨验证、打通从科研到应用的闭环,才能把“星座时代”的数据洪流转化为高质量的信息供给,进而在未来空间信息体系中赢得主动。