塔斯娱乐资讯网

国产高速网彻底支棱了!万卡时代兜底国产算力 现在AI圈卷到什么程度?去年还在秀千

国产高速网彻底支棱了!万卡时代兜底国产算力
现在AI圈卷到什么程度?去年还在秀千卡集群,今年没有万卡都不好意思打招呼。Meta屯35万张H100,GPT-5据说要用20万卡。规模战打到最后,拼的是什么?是稳定。
打个比喻就是,如果把智算中心比作工厂,GPU是工人,高速网络就是传送带。传送带一卡,再多的工人也只能干瞪眼等着。
那谁来兜这个底?这次曙光给的答案是:自己给自己兜底。你没听错,刚发布的scaleFabric高速网络最大的底气在于,曙光自己就是自己的“小白鼠”。其工程师透露,这套产品已经测试超过长达10个月的时间,累计50万小时的设备稳定性测试,1100万小时的端口链路测试,甚至做了超过100个极端天气的验证。
这叫什么?这叫用给自己盖房子的标准,给别人盖房子。所以当别人还在PPT里吹性能的时候,曙光已经能在发布会上说现货可供,即插即用。
这一点,用过RoCE的人感触最深。以前建个万卡集群,光调优就得养一个专家团队,调水线、调参数,一调几个月。现在scaleFabric基于原生IB架构,从根儿上就是无损的,拿来就能跑。这不仅是技术账,更是成本账和人效账。
工信部数据说,过去我国万卡智算集群已经建了42个,今年要突破10万卡。在这个节骨眼上,国产网络的成熟,不只是一款产品的胜利,是整个中国智算体系向上晋升的跨越。
发布会现场邬贺铨院士有一句话说的好,RDMA网络是智算集群的算力大动脉。现在这条大动脉,咱们终于自己打通了。
scaleFabric 智算集群 AI