AI Fabric智算中心网络解决方案-锐捷网络

锐捷睿易锐捷官方商城

中文

登录

产品

< 返回主菜单

产品

交换机

交换机所有产品

< 返回产品

交换机

园区网交换机

园区网交换机

数据中心与云计算交换机

数据中心与云计算交换机

中小网络精简型交换机

中小网络精简型交换机

工业交换机

工业交换机

意图网络指挥官

意图网络指挥官

SDN

配件

查看交换机首页 >

所有技术解决方案

路由器

路由器所有产品

< 返回产品

路由器

核心路由器

核心路由器

汇聚路由器

汇聚路由器

接入路由器

接入路由器

移动路由器

移动路由器

路由器应用软件

路由器应用软件

中小网络路由器

中小网络路由器

查看路由器首页 >

所有技术解决方案

无线

无线所有产品

< 返回产品

无线

放装型无线接入点

放装型无线接入点

墙面型无线接入点

墙面型无线接入点

智分无线接入点

智分无线接入点

室外无线接入点

室外无线接入点

场景化无线

场景化无线

无线控制器

无线控制器

小锐A系列

无线管理与应用

无线管理与应用

查看无线首页 >

所有技术解决方案

物联网

物联网所有产品

< 返回产品

物联网

物联网基站/网关

物联网基站/网关

查看物联网首页 >

所有技术解决方案

云桌面

云桌面产品方案中心

< 返回产品

云桌面

云终端系列

云终端系列

云主机系列

云主机系列

云桌面软件系列

云桌面软件系列

配件系列

查看云桌面首页 >

所有技术解决方案

安全

安全所有产品

< 返回产品

安全

大数据安全平台

大数据安全平台

下一代防火墙

下一代防火墙

安全网关

检测管理安全

检测管理安全

应用防护安全

应用防护安全

安全服务

查看安全首页 >

所有技术解决方案

统一运维

统一运维所有产品

< 返回产品

统一运维

IT运维产品

查看统一运维首页 >

所有技术解决方案

身份管理

身份管理所有产品

< 返回产品

身份管理

安全管理系列

安全管理系列

运营管理系列

运营管理系列

身份中台

查看身份管理首页 >

服务产品

服务产品所有产品

< 返回产品

服务产品

基础实施服务

基础实施服务

基础维护服务

基础维护服务

运维管理服务

运维管理服务

整网服务

安全服务

备件与扩容服务

备件与扩容服务

培训与认证服务

培训与认证服务

查看服务产品首页 >

产品中心首页 >

官方商城

锐捷睿易

体验中心

行业

< 返回主菜单

行业

运营商

< 返回行业

运营商

运营商首页 >

政府

< 返回行业

政府

政府首页 >

金融

< 返回行业

金融

金融首页 >

互联网

< 返回行业

互联网

互联网首页 >

电力能源

< 返回行业

电力能源

电力能源首页 >

制造业

< 返回行业

制造业

制造业首页 >

高教/职教

< 返回行业

高教/职教

高教/职教首页 >

普教

< 返回行业

普教

普教首页 >

医疗卫生

< 返回行业

医疗卫生

医疗卫生首页 >

交通

< 返回行业

交通

交通首页 >

地产酒店文旅·连锁服务

地产酒店文旅·连锁服务

< 返回行业

地产酒店文旅·连锁服务

地产酒店文旅·连锁服务·场馆园区首页 >

公共安全

< 返回行业

公共安全

公共安全首页 >

行业中心首页 >

锐捷睿易

体验中心

服务支持

< 返回主菜单

服务与支持

服务工具

服务平台

技术支持

服务产品

产品服务

教学服务

合作伙伴

< 返回主菜单

合作伙伴

成为锐捷伙伴

售前营销

销售与订单

售后及服务

用户中心

关于锐捷

< 返回主菜单

关于锐捷

公司介绍

公司动态

加入我们

联系我们

营销资料平台

投资者关系

返回主菜单

选择区域/语言

中文 English 日本語 Türkçe việt nam Indonesi ภาษาไทย Español Português Français Polski România Pусский Deutsch Italiano

背景概述

项目咨询

背景概述
方案价值
明星产品
相关链接

变局与挑战

随着AI模型不断演进，模型参数持续攀升，智算中心的能力提升迫在眉睫。
受限于网络通信性能，大规模分布式GPU集群的计算效率仍然难以实现线性增长，智算中心的发展面临重重挑战。

组网规模需求大

组网规模需求大

AI训练需要大规模GPU集群组网和分布式并行计算解决集群规模与GPU效率的平衡，网络需要支持数千甚至上万卡GPU集群建设

网络性能要求高

网络性能要求高

大模型的机间网络通信占比提升，高带宽接入及高带宽利用率成为影响训练效率的网络关键指标

建设部署时间紧

建设部署时间紧

项目建设周期紧，需要业务快速上线，对网络的部署时效提出了更高要求

运维管理难度高

运维管理难度高

在训练期间如果出现网络不稳定的问题，会影响整个训练任务的进度

锐捷网络AI-Fabric智算中心网络解决方案

满足AI模型的训练需求

超大规模组网

极致高吞吐网络

快速部署上线

AI智能运维

GPU服务器通常配置多张网卡用于参数训练，为了提升GPU训练效率，保障集群通讯的低时延无损通信，锐捷网络AI-Fabric网络解决方案采用多轨组网架构，让同号网卡连接到同一网络Pod组内，使训练业务的流量限定在同一Pod组或同一Tor设备上，从而减少转发跳数，大幅降低网络转发时延；同时为了构建高算力的大规模GPU集群，锐捷网络AI-Fabric网络解决方案采用三级组网，各层级按照1: 1的收敛比的设计，最大可以提供32768个400G端口，实现32K个GPU的集群承载。

AI-Fabric 三级多轨组网架构

三级组网：承载GPU大规模集群，实现服务器间的高速通信；
多级架构：减少转发跳数，降低通信时延，提升业务亲和力；

单芯片25.6Tbps，盒-盒架构

交换机端口: 64 x 400GbE
二级组网架构：最大 2K GPU
端口SerDes : 56Gbps
三级组网架构：最大 8K GPU

单芯片25.6Tbps，盒-盒架构

交换机端口: 128 x 200GbE
二级组网架构 : 最大4K GPU
端口SerDes : 56Gbps
三级组网架构 : 最大16K GPU

单芯片51.2Tbps，盒-盒架构

交换机端口: 128 x 400GbE
二级组网架构 : 最大8K GPU
端口SerDes : 112Gbps
三级组网架构 : 最大32K GPU

方案价值

超大规模组网

超大规模组网

采用多轨组网架构，支持按需灵活部署；
三级组网最大可支持32K个GPU集群；

极致高吞吐网络

极致高吞吐网络

高带宽、低时延的RoCE无损网络设计；
RALB技术保障网络的高带宽利用率；

快速部署上线

快速部署上线

RoCE一键部署，提升上线效率；
多个应用案例和大规模RoCE调优经验；

AI智能运维

AI智能运维

实时遥测关键指标，可视化呈现；
多维度监控和分析，防患于未然；

明星产品

RG-S6980-64QC

RG-S6980-64QC 64口400GbE交换机了解详情 >

即将上市

即将上市 128口200GbE交换机

即将上市

即将上市 128口400GbE交换机

相关链接

到底什么样的网络，才能带得动AIGC

IT影响中国2023：锐捷AI-FlexiForce智算中心网络解决方案荣获影响力解决方案奖

售前咨询
售后服务
意见反馈

返回顶部

请选择服务项目

售前咨询

售后服务

意见反馈

更多联系方式