全球首个公开号称能跑到吉瓦级的ai 训练大杀器

咱先聊聊这事儿。就在5月20日这天,马斯克在网上发消息说,他的xAI公司在田纳西州孟菲斯搞的那个“Colossus 2”超级计算机集群,正式干活了。这可是全球首个公开号称能跑到吉瓦级的AI训练大杀器。算上这次,它今年4月还能再把算力推高到1.5吉瓦。这东西主要是给xAI家的聊天机器人Grok当后台使的。 据我所知,这个“巨像”占地面积得有8.6万平方米,这规模相当于13个标准足球场那么大。硬件配置方面,它在2024年夏天刚启用那会儿,大概往里塞了10万块英伟达H100 GPU。等到了2025年2月,规模又翻了一番,现在大概有20万块GPU在那跑呢。按照计划,以后它还得接着扩容。 不过话说回来,这么个大家伙对电的需求量那是相当惊人。以前听说过这个数据中心为了防停电,直接从电网搞了150兆瓦的电配额,还配套建了一样多容量的特斯拉Megapack储能电池。这就是典型的“电网+储能”双保险模式嘛。 但就在大家盯着这台超级计算机的时候,它也因为供电方式惹上了环保纠纷。美国环保局(EPA)那边调查了好久,最后在5月19日把裁定给了出来。他们认定xAI在给Colossus供电的时候,偷偷运行了几十台天然气涡轮发电机。 最开始xAI还想耍赖皮说这是临时用的不用管,但环保局没给面子,直接指着他们违反了《清洁空气法》。有人分析说,这事儿反映出了一个大矛盾:一方面大家都在抢算力这块大蛋糕,逼着大家搞这种超大规模的集群;另一方面就是这么耗电的大家伙要怎么才能变得更环保可持续,这让各国政府和企业都头疼。 数据显示全球数据中心的电耗大概占总电量的1%到1.5%,而且AI这块的占比还在蹭蹭往上涨。现在“Colossus 2”跑起来了,说明AI算力建设已经到了新的阶段了。这种级别的训练集群不光能把大模型训练周期大大缩短,还能给多模态AI或者具身智能这些新方向提供基础。 业内人士也说了,一旦算力突破了某个节点,可能就会冒出一些新的AI玩法。大家拼命搞超算集群也就是为了这个。“Colossus 2”正式上线既是这场算力竞赛白热化的表现,也是科技产业站在能源转型和技术创新交叉路口的一个信号。 以后怎么在追求算力突破的同时又不污染环境、把数字基建搞得更绿色可持续,这可是检验企业有没有社会责任感的一杆秤。现在各国对数据中心的能效标准和碳排放监管都在加码,“巨像”之后的发展轨迹肯定会跟绿色计算的大趋势紧紧绑在一起。