交换机
园区网交换机
数据中心与云计算交换机
行业精选交换系列
意图网络指挥官
无线
放装型无线接入点
墙面型无线接入点
智分无线接入点
室外无线接入点
场景化无线
行业精选无线系列
无线管理与应用
随着数据中心架构的发展和VXLAN、RDMA等新技术的应用,传统的SNMP等运维手段已经无法满足当前IDC运维需求。更大规模、更复杂的云数据中心和高性能计算集群都对运维提出了更高的要求,如何找到更加精细化、智能化的运维手段,实现对网络更高效、及时地监控和运维,成为数据中心网络运维面临的一大挑战。
在前几期的《技术盛宴》栏目中,我们介绍了基于交换机硬件芯片的INT(In-band Network Telemetry,带内网络遥测技术)技术实现运维可视化的方案,本文将在前文基础上详细介绍INT技术具体如何实现运维可视化。
INT技术背景及可视化方案
Telemetry是一项远程的从物理设备或虚拟设备上高速采集数据的技术。设备通过推模式(Push Mode)主动向采集器推送设备数据信息,提供更实时更高效的数据采集能力。
▲ Telemetry模型
Telemetry技术采取推送方式,由设备主动向后台监控服务器推送自身信息,从而避免了查询模式下查询请求造成的在网络中的额外延时,以及大量查询请求给网络和设备带来的压力。与传统的SNMP、CLI、SYSLOG等方式相比,Telemetry可以实现亚秒级监控精度。理论上,通过Telemetry技术可以获取设备所有信息。
INT技术是由Barefoot、Arista、Dell、Intel和VMware在Telemetry的基础上共同提出的一种新的Telemetry模型。INT技术是通过在数据层面收集和报告网络的状态来实现对网络状态的监控,这个过程不需要控制层面的参与。
INT架构模型中的术语:
●INT header:任何包含INT信息的packet header;
●INT Source:在报文中嵌入INT header的设备;
●INT Instruction:收集数据信息的定义;
●INT Metadata:监控对象信息,即在每台设备上收集的数据信息;
●INT Transit Hop:加入本设备节点INT Metadata信息的设备;
●INT Sink:拆除INT header报文头,并收集上送INT Metadata信息的设备。
基于INT实现运维可视化的具体流程:
1、业务报文进入第一台交换机(INT Source),通过交换机上设置的采样方式采样并镜像出该业务流报文,INT Source在报文中封装一个INT header,同时定义INT Instruction,并在INT header后添加INT Metadata,将需要收集的交换机信息填入INT Metadata 中。
2、报文转发至下一台路径上的交换机(INT Transit Hop),INT Transit Hop根据上一台设备的INT Metadata内容继续添加本机的INT Metadata 信息。
3、经过所有INT Transit Hop,报文转发至最后一台交换机(INT Sink),INT Sink将INT Header拆除,并将其中的路径信息通过gRPC报文发送给后端的监控服务器进行解析和呈现。
▲ 可视化网络
通过上图我们可以清楚地了解到INT的具体流程,简单地说INT就是在报文转发路径上的每台设备上收集Metadata数据,通过对Metadata数据的分析来准确监控网络状态。那么Metadata中有哪些数据可以提供给我们来监控网络呢?
INT Metadata报文信息详解
INT Metadata报文格式:
从上图中可以看到INT Metadata报文包含8个字节的报文头和多个Metadata数据,每个Metadata数据,即每一跳设备收集的数据信息。
INT Metadata报文头中包含几个关键的字段:
●Ver(2bit):版本号;
●Flags(9bit):包括复制允许、超过最大跳数置位等以及5bit的Reserved预留;
●Instruction Count(5bit):Metadata中收集数据项的数量;
●Max Hop Count(8bit):最大跳数,即报文中可封装的Metadata数据的最大数量;
●Total Hop Count(8bit):当前总跳数,即当前报文中封装的Metadata数据的数量;
●Instruction Bitmap(8bit):Metadata数据的具体内容。
Instruction Bitmap 字段8个bit分别对应8个数据选项,每个bit的置位代表该项数据需要收集到Metadata中。
●bit0:交换机ID
●bit1:入端口号
●bit2:转发时间
●bit3:队列占用
●bit4:入时间戳
●bit5:出端口号
●bit6:队列拥塞状态
●bit7:出端口链路利用率
举个例子,上图是一个INT Metadata报文头,我们看下其中的具体信息:
●Instruction Count字段数值为2,表示Metadata中共收集两项数据;
●Max Hop Count字段数值为16,表示最大支持16跳,可封装16个Metadata数据;
●Total Hop Count字段数值为3,表示当前为第3跳,报文已封装了3个Metadata数据;
●Instruction Bitmap字段,2个bit置位,表示Metadata数据中包含两个数据项,交换机ID(bit0)和队列占用(bit3);
●Metadata数据部分即为每一跳交换机封装的交换机ID以及队列占用信息。
总结一下,INT技术可以基于交换机芯片提供的可视化能力,通过收集分析数据报文在交换机网络中转发的详细信息,实现流量转发的路径可视化和延时可视化,为实现数据中心网络运维可视化提供了新的解决方案。锐捷网络新一代25G/100G数据中心网络解决方案已全面支持INT功能,欢迎留言交流。
本期作者:刘臣平
锐捷网络互联网系统部行业咨询
往期精彩回顾
●【第二期】如何通过网络遥测(Network Telemetry)技术实现精细化网络运维?
相关推荐:
锐捷网络推出磐石无线解决方案,突破传统无线网络的“随机性顽疾”,提供高可靠、低延时、强抗干扰的无线连接。通过无线双链路技术、零漫游技术和空口智驾技术,保障关键业务不中断,满足高密场景(如高校图书馆、智慧医院)和移动业务场景(如智能制造、仓储物流)的稳定需求。结合无线智控中心引擎(WIE)实现智能运维,降低TCO,助力企业数字化转型。磐石无线已在半导体、教育、制造等行业落地,打造“确定性无线”新时代!
#网络管控
锐捷网络2025合作伙伴大会发布创新"体验驱动网络(EDN)"解决方案,通过UNC统一网络平台实现高效运营、业务随身行安全管理和AI智能运维三大核心体验,助力企业构建新一代智慧园区网络。EDN方案融合DeepSeek AI技术,提供端到端业务保障,推动企业数智化转型,与合作伙伴共同打造以用户体验为核心的网络新生态。
#网络管控
锐捷网络在EBG核心伙伴大会发布安全云办公3.0解决方案,以VDI创新技术突破传统云桌面体验瓶颈,通过自研Flex-vGPU(成本降30%)、4K双屏协议(带宽减半)及弹性计算实现高性能图形处理,同时提供一站式数据安全(智能加密+外发审批)。方案全面适配国产化生态(UOS/麒麟/ARM),已服务中化集团、五菱新能源等标杆客户,助力金融、制造、医疗等行业实现思杰替代与3D设计上云,重新定义安全与体验并重的云桌面新标准。
#医疗
#VDI
#云桌面
#互联网
#政府
#交通
#普教
#高职教
2025锐捷网络EBG核心伙伴大会重磅发布“网络+安全一体化”超预期解决方案,直击渠道伙伴交付难、信任危机、体验黑箱三大痛点,通过EDN统一管理、AI智能运维、云+AI溯源闭环等技术,实现分钟级威胁响应与业务体验可视化。锐捷安全深耕教育、政府、金融等五大行业,服务全球35,000+客户,携手腾讯安全等生态伙伴构建协同防御体系,并创新引入AI大模型强化威胁检测,助力合作伙伴简化交付、提升客户信任,共赢数字化安全新未来。
#安全