近日,中国电信统一组织,中国电信研究院、中国电信北京公司、天翼云公司共同参与,在中国电信现网上,基于800G C+L技术,为1024卡规模的分布式集群提供大容量带宽,实现了120公里、千亿参数大模型的分布式训练,性能达到集中训练的95%以上。
这验证了大带宽、高可靠、高效率光传输网络为智算互联构建坚实底座的可行性,在全球还是第一次。
随着智算集群规模达到千卡、万卡,所需带宽往往高达百T比特级,甚至超P比特级,因此,光传输系统的大带宽、高可靠与高效率的特点是保证分布式训练高算效的关键。
针对数据传输的大带宽问题,中国电信采用高阶调制格式的单波长800G技术,以提高频谱效率,配合当前的业界热点的C+L波段技术,实现了超大传输带宽。