随着大模型参数规模突破万亿级,智算集群已成为算力基础设施的核心。而网络作为智算集群的“神经系统”,其性能将直接影响大模型训练和推理效率。 传统网络架构极易因通信延迟、带宽争用等导致昂贵的算力资源闲置。此外,传统网络依赖单一厂商的“黑盒”设备(通常包含交换机、专有操作系统及管理软件),技术栈封闭,升级、运维受制于厂商