阿里发布智算集群HPN 7.0:51.2Tbps单芯片以太网交换机

在2024年的国际顶会SIGCOMM上,阿里云发布了六篇论文。其中引人注目的是介绍其最新一代智算集群网络架构HPN 7.0的论文,这也是SIGCOMM历史上首篇关于AI智算集群网络架构的论文。

HPN 7.0是为满足AI时代对网络高性能需求而研发的,它创新性地设计了“双上联+多轨+双平面”的网络架构。同时配备51.2Tbps单芯片以太网交换机、400G高性能网卡和自研的Solar-RDMA和ACCL通信库。这些技术的应用使得HPN 7.0能够实现单层千卡、两层万卡的高性能和高稳定性互联。

自2023年9月起,HPN 7.0已在阿里云进行大规模部署,并显著提升了大模型训练性能和智算网络的整体稳定性。基于HPN 7.0架构训练的通义千问2.5版本大模型,在理解能力、逻辑推理、指令遵循、代码能力等方面均有显著提升,中文性能全面赶超GPT-4 Turbo。

阿里云基础设施网络负责人蔡德忠表示,HPN 7.0的推出是阿里云自2017年以来在端网融合可预期网络技术体系探索上的又一里程碑。这一全新的网络集群架构创新有望成为下一代AI高性能网络架构的新范式,与谷歌的Jupiter网络相媲美。

ai.zol.com.cn true https://ai.zol.com.cn/871/8715961.html report 860 在2024年的国际顶会SIGCOMM上,阿里云发布了六篇论文。其中引人注目的是介绍其最新一代智算集群网络架构HPN 7.0的论文,这也是SIGCOMM历史上首篇关于AI智算集群网络架构的论文。HPN 7.0是为满足AI时代对网络高性能需求而研发的,它创新性地设计了“双上联+多轨+双平面”...

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部