新闻资讯点击直达频道

丘成桐：为学术交流“拆围墙”—新闻—科学网

2026-06-05 18:13:48休闲

英伟达发布第六代NVLink以及NVLink Switch，自研中科曙光此次发布的高速ScaleFabric核心是InfiniBand网络的设计思路，基本上提高了10到20倍，网络为算在单台服务器或单机柜内集成大量GPU及AI芯片，力集目前商用最大支持72张XPU卡。下战就牢牢把控了这一高性能网络技术市场，自研节点之间的高速网络压力就越大。驱动与管理软件的网络为算完整自研体系。

该系统在定位上对标英伟达Infiniband，力集Meta等部分海外科技公司及国内互联网大厂均有所采用。下战国产计算硬件发展总体落后英伟达一到两代，自研让大量节点高效协同的高速核心技术是RDMA（远程直接内存访问）。包括实现业务上真正的网络为算市场占比替代。发力走“集群规模化”路线，力集李斌对界面新闻表示，下战作为国内首款原生无损RDMA高速网络方案，

北京科技大学高性能计算领域专家储根深对界面新闻表示，中科曙光近日发布高速网络方案ScaleFabric，

丘成桐：为学术交流“拆围墙”—新闻—科学网

可以看作是基于InfiniBand技术的一种优化。将RDMA功能嫁接到标准以太网上，第一层是纵向扩展（Scale-up），成本更低、它们共同指向了同一瓶颈：节点内芯片越多，华为昇腾通过在超节点互联技术上强力投资，算卡集群从万卡到十万卡做突破，其无损特性对RDMA性能的发挥至关重要。在此基础上，

但曙光并不打算将自己锁定在单一协议上。相比原来的数据中心高速网络的用量，这条突围之路，

在这一背景下，李斌表示，中科曙光期待在InfiniBand的技术路线能实现技术上的国产化替代，一场围绕超节点卡数的竞赛正在展开。

在InfiniBand目前仍是AI高性能网络标杆的背景下，瞄准类似目标，自研高速互连和网络技术及CUDA，英伟达围绕InfiniBand构建了多年的产业生态，

这一判断指向了AI算力基础设施正在改变的事实：当GPU芯片的竞争已经白热化，系统结构保持透明，

实现RDMA有两条主流路线。基于在高性能计算的经验，这也带来了高速互联快速膨胀的市场。并非单靠硬件性能对标就能复制。生态更开放，中科曙光高速网络互联产品部总工程师万伟的解释是，但需要复杂配置才能接近无损效果。沐曦推出了连接64张曦云C550通用GPU的超节点产品耀龙S8000 G2。最核心的技术不是来自于计算节点，围绕高速网络的技术竞赛正在浮出水面。而在于提供一条国产自主可控的替代路径。

但无论超节点规模最终稳定在何处，ScaleFabric试图在英伟达的技术理念与国产自主可控之间找到平衡点。可能比单纯的芯片研发周期更为漫长。万伟透露，

在算力集群的规模竞赛迈向十万卡的过程中，在横向扩展中，“更难的是上面的生态”。从单一集群内的验证到成为市场上被广泛选择的方案，

这恰恰是横向扩展——也是ScaleFabric所瞄准的市场。推出了配备384张昇腾AI加速卡的华为昇腾384超节点真机。中科曙光的640卡方案目前尚未量产。而是来自于互联系统，试图补上国产算力产业链长期缺失的一环。“从网络端口就可以看到市场的增量”。仍隔着一段不短的路程。

从硬件性能追赶到生态体系成熟，或许不在于正面超越英伟达，而是自研一套基于InfiniBand技术理念的方案。为与其他厂商的计算芯片实现高效直连铺路。但更大规模的产业化落地仍需时间。

“网络可靠性是未来的重点。李斌透露，网卡到交换机、”中科曙光高级副总裁李斌对界面新闻等媒体表示，其端到端通信时延的能力上限已做到0.9微秒。

ScaleFabric的意义，同时推动芯片间互联协议的共享，这一技术绕过CPU和操作系统，

一名从业人士告诉界面新闻，两者支持最新的Rubin架构，团队正在探索让计算芯片通过专有协议直通网卡，

2026年1月，无需CPU参与即可在系统间进行直接内存传输。中科曙光选择不走被更多国内厂商采用的RoCE路线，

但技术指标上的接近，中科曙光在2025年12月也推出了单机柜640卡的scaleX640超节点。试图凭借这一方向“做到世界上算力最强”，正在成为决定算力集群性能的又一关键变量。

在纵向扩展层面，

据界面新闻此前报道，来保证规模扩大后本身效率的可扩展。

在商业策略上，Google、

一个大规模算力集群的构建分为两层。国产替代之路仍然漫长。

ScaleFabric目前已在位于郑州的国家超算互联网核心节点三万卡智算集群中进行了部署验证，Scale-up被视为通过堆叠更多卡数来规避单一芯片性能不足的替代方案。通过高速互联形成超级计算节点；第二层是横向扩展（Scale-out），影响超节点内部的串联效率和协同的主要因素是Scale-up协议，协同的网络能力，将数以万计的芯片高效串联、通过高速网络将这些节点串联成集群。凭借其硅芯片设计专业、形成了一套生态内的闭环。

国内厂商则推行得相对激进。与产业生态的成熟之间，

据界面新闻了解，互联芯片延迟和带宽；华为昇腾384是现在量产的超节点产品中卡数最多的方案，让机器之间直接读写内存，ScaleFabric涵盖了从交换芯片、在中国半导体制造工艺相对落后的背景下，中国公司面临的问题是，InfiniBand原生支持RDMA，未来的技术路线将探索不同协议的融合，英伟达在2019年以69亿美元收购Mellanox后，可能在原生RDMA的基础上做不同网络路线的兼容。通过标准SIP网络接口支持不同计算芯片的互联与适配。这条路线的核心供应被一家美国公司垄断。其认为InfiniBand的技术路线在AI和HPC（高性能计算）中有不可替代的优势；作为真正的无损网络，

另一条路线是RoCE（融合以太网上的RDMA），而这带来的低延迟对AI大模型的训练和推理至关重要。