交换机
园区网交换机
数据中心与云计算交换机
行业精选交换系列
无线
放装型无线接入点
墙面型无线接入点
智分无线接入点
室外无线接入点
场景化无线
无线控制器
行业精选无线系列
无线管理与应用
安全
下一代防火墙
安全网关
检测管理安全
所有技术解决方案
服务产品
AIGC(Artificial Intelligence Generated Content,生成式人工智能)技术利用训练有素的生成式模型来生成自然语言文本、图像、音频等多样化内容。在其网络架构中,网卡(Network Interface Card,NIC)扮演着至关重要的角色,作为连接计算机和网络的关键设备。其主要职责包括将计算机产生的数据有效地发送到网络中,并负责接收来自网络的数据。网卡设备对于确保 AIGC 网络的高性能和可靠性具有重要意义,为数据传输和网络连接提供了可靠的基础支持。
网卡双上联的产生原因
网卡双上联是一种架构,它将服务器或网络设备的两个物理网卡同时连接到不同的网络上级设备或交换机上。
在传统的网卡单上联架构下,无论是光纤还是交换机出现异常,都会导致AIGC训练任务中断,因训练中断将造成训练成本增加和客户品牌的负面影响。此外,交换机升级期间,AIGC训练业务也需要提前迁移。这对用户体验、系统稳定性以及网络运维都带来了很多问题。
相比之下,网卡双上联架构中,服务器上的所有网卡的两个端口分别连接到不同的交换机,并通过绑定这两个端口形成一个bond端口来提供服务。这样,当一个上联链路或对应的接入层交换机出现故障时,流量可以切换到另一个端口,确保训练任务不会中断。
双上联架构设计避免了网卡单上联接入交换机带来的单点故障风险,极大提高了整体系统互联的鲁棒性。此外,这也为集群系统的交换机热升级创造了条件,使得整体网络运维和功能迭代变得更加方便。
以下是当前交换机支持的几种网卡双上联架构解决方案:
网卡的每个端口分别配置2个不同的IP地址,通过网卡配置将流量分散不同的路径。网卡对外虚拟为2个不同的网卡,天然复用交换机当前成熟的IP转发特性。当其中1个端口或IP地址失效时,另一个端口/IP地址也可以继续工作。
网卡双IP是一种灵活且高效的网络配置方案,适用于多种应用场景。但部分集合通信库对于双IP的支持度较差,且出现多QP性能下降的情况;此外该方案需要为网卡多分配1倍的IP地址,IP地址资源存在浪费。
去堆叠
去堆叠方案为我司提出的创新性解决方案。去堆叠方案是指网卡和交换机之间通过bond绑定为聚合口,网卡侧对于ARP/ND实现broadcast,即2个端口同时发送ARP/ND报文,使得2台接入的交换机可以同时学习到网卡的ARP/ND,2台接入交换机将ARP/ND转换为BGP路由,向其他设备通告BGP路由。
去堆叠可以保持业务接入方式不变,同时2台交换机之间无需物理关联,并且能很好适配网卡双上联接入。
去堆叠+双平面是在去堆叠方案的基础上,将交换机划分为不同的转发平面,每个网卡双上联的不同端口映射至不同的网络平面。即2个网卡端口分别接入到不同的交换机,这2台交换机分别接入到不同的平面。
采用去堆叠+双平面的方案,网卡发送端在bond端口发送流量时只要保证流量均分至发送侧的两个端口,那么在接收侧的接入层交换机也一定会收到均匀的网络流量,大幅度降低了哈希极化的发生概率。
同时,基于双上联和双平面接入的设计,使2层CLOS网络的单集群最大拓展规模翻倍,获得整集群通信拓扑简化、降低时延、降低成本等收益。
M-LAG(Multichassis Link Aggregation Group,跨设备链路聚合)是一种跨设备链路聚合技术,通过2台设备连接组成双活系统,控制平面互相独立,交换机之间通过peer-link链路进行通信和同步。M-LAG组的2台设备对外等效为1台设备,该等效设备和下联设备之间通过聚合口互联。
M-LAG架构具有高可靠性,如果一个交换机或链路发生故障,流量可以自动切换到其他正常工作的链路或交换机,从而确保网络的高可靠性和冗余;此外还能使网络拓扑更加简洁,多个物理链路在逻辑上看作一个链路,简化了网络配置和管理。但是M-LAG是私有实现,同组M-LAG只能是相同厂商的设备,跨组M-LAG设备不存在此限制。
E-AP ( Enhanced Aggregation Port )是一种跨设备链路聚合技术,它是由多台支持链路聚合的独立设备组成的系统。该系统可以等效成一台设备,与下联设备进行链路聚合,从而将链路可靠性提高到设备级,以满足高可用性场景的要求。当某条链路故障或者设备故障时, E-AP将自动切换数据业务至E-AP组中其他可用的链路或设备上,从而实现设备级的可靠性。
E-AP通过私有协议通信,无需额外增加设备之间的互联链路,就能支持网卡双上联架构。E-AP架构同样具有高可靠性,能支持物理链路的冗余备份,降低单点故障的风险。
VXLAN Multihoming是指在VXLAN网络中,一个VXLAN实例(通常是一个租户或一个虚拟网络)通过多个物理网络接口或多个不同的网络路径连接到VXLAN网络,视为相同EVI接入,VXLAN实例表项通过BGP EVPN进行同步。利用VXLAN Multihoming架构技术,在网络中部署VXLAN虚拟网络,从而实现网卡双上联到不同交换机。
VXLAN Multihoming是RFC标准实现,为网络提供冗余连接,支持网卡双上联。VXLAN Multihoming允许网络流量在多个链路之间进行分配,从而提高网络的吞吐量和效率;此外,VXLAN Multihoming具有较高的灵活性和扩展性。
我们对不同方案进行了评估,综合考虑了资源占用情况、支持网卡规模、流量均衡、部署难度和运维难度等多个维度,每个方案都有其独特的优势和局限性,选择时应根据具体需求和现有资源进行权衡。
选择最合适的网卡双上联方案需要综合考虑网络架构的当前和未来需求,以及对性能、可靠性和成本的影响。通过仔细评估每个方案的优劣,可以为AIGC网络设计一个既高效又可靠的网络环境
锐捷网络,作为GenAI时代的全栈服务专家,致力于为企业提供覆盖IaaS到PaaS的全栈产品及解决方案。我们的产品覆盖高性能网络与GPU算力优化调度,旨在通过创新技术解决方案,帮助客户实现生产效率的飞跃与运营成本的优化。我们坚信,通过我们的努力,能够为客户打造一个更加智能、高效和可靠的未来。让我们携手,共同探索GenAI时代的每一个机遇。
相关标签:
点赞
锐捷网络以太彩光解决方案在中国以太全光网络市场排名第一,服务制造业、教育、医疗等30万间入室场景。方案通过彩光技术、无源汇聚和智能运维,为企业提供稳定可靠、灵活扩展的网络基础设施,支持办公、生产、Wi-Fi 7等多场景需求,助力企业智能制造与数字化转型。
#制造业
#全场景
#交换机
#园区网
锐捷网络推出RG-CMG6000“聪明哥”系列智能安全网关,采用7合1高度集成设计,整合路由、防火墙、VPN、行为管理等核心功能。方案支持基于7000+应用特征的精准行为管控、会话与流量双重负载均衡技术,并通过INC-EMB平台实现统一纳管,为教育、医疗及中小企业提供更高效、更可靠的一站式网络出口解决方案。
#安全
锐捷网络极简以太彩光4.0解决方案针对校园光网络运维推出创新管理模式,通过UNC统一网络中心实现设备即插即用上线、光链路秒级故障诊断、精准告警压缩和智能决策支持,有效解决高校网络运维中设备上线效率低、故障定位难、告警冗余及数据支撑不足等核心问题,助力教育行业数字化转型,提升运维效率90%以上。
#交换机
#普教
#高职教
#教学网
锐捷网络推出极简以太彩光方案,采用160G高密彩光技术,实现全链路单芯传输与光链路可视化管理。方案涵盖框式核心交换机、超聚合彩光交换机及无源透明汇聚设备,支持万兆入室,简化布线架构,提升部署效率与网络可靠性,适用于高带宽、高密度园区网络场景,助力企业光网络建设更简单高效。
#交换机