Mellanox推出故障快照网络遥测技术

2019年5月21日,Mellanox宣布,推出先进的网络遥测技术,为公有云、私有云和企业计算实现数据平面异常情况的高度可视性。

故障快照工作流程

故障快照 (What Just Happened, WJH) 是一种全新的智能监测技术,远远优于传统的流遥测(Streaming Telemetry)和带内网络遥测 (Inband Network Telemetry) 技术。传统的遥测技术从网络端口计数器、统计数据包采样和逐跳带内网络遥测数据中提取数据,因而会产生大量的数据。这类遥测数据缺乏关于异常网络行为的上下文或可操作详情,使网络管理员不得不采用各种监视工具执行长时间的分析,才可能找出网络问题的根本原因。基于 WJH 事件的遥测技术提供直接、可操作的信息,无需再为排除网络故障而进行推测。

故障快照WJH 解决方案利用 Mellanox Spectrum™ 和 Spectrum™-2 以太网交换机芯片内置的独特硬件功能,以T-比特级别的速率检测数据包,速度远远快于业界传统的的基于软件或固件数据包检测的解决方案。在基于 Mellanox 的交换机系统中,WJH 以线速检测所有端口上的数据包,这是传统的深度数据包检测解决方案无法无法企及的速度。然后,WJH 会识别异常行为,将其整合为简洁、具体且可操作的数据,从而实现云应用程序和关键业务操作的快速修复与恢复。WJH 现已可用于最新版 Mellanox Onyx™、Cumulus Linux 和 SONiC 网络操作系统。Mellanox WJH 技术支持开放以太网,可以轻松与 InfluxDB、Grafana、Kibana 等开源工具集成,也可以与 Mellanox NEO 和 Cumulus 的 NetQ 等数据中心范围的监控解决方案相结合。

Mellanox Technologies 以太网交换机事业部副总裁 Amit Katz 表示:“我们最先进的以太网交换机已经在市场上大规模部署,提供业界领先的延迟和数据包转发性能。如今,客户需要一个更智能的网络,除了完全无感知自动安装和配置外,还需要在故障排除时可以为您清晰展现原始现场。每个尝试过故障快照WJH 的客户都会倍感惊讶 — 故障快照WJH 竟能如此迅速地发现其网络中那些从未被人知晓的行为。我们为所有客户免费提供先进的 WJH 遥测技术,而无需像业界常见做法,那样为每个额外的功能购买功能许可证。WJH 是技术发展的推动者,是实现自主和自愈网络不可或缺的元素。”

HPE 存储网络研发总监 Rupin Mohan 表示:“Hewlett Packard Enterprise 存储网络产品采用Mellanox Spectrum系列交换机(HPE M-系列)。对于存储管理员来说,排除网络和 SAN 故障始终是一项挑战。  借助 故障快照WJH技术,我们解决了这个问题,能在几分钟内轻松排除严重的网络故障。这正是 ESF (Ethernet Storage Fabric)的强大之处,它不再只是单纯的以太网交换机。故障快照WJH 和 智能网络部署Smart Fabric Orchestrator (SFO) 的组合增强了 HPE M-系列解决方案,并通过提供高级诊断简化了 SAN 管理和故障排除,从而帮助业务正常运行,同时不会降低网络性能。”

Cumulus Networks 首席执行官 Josh Leslie 表示:“随着 Web-scale 网络成为企业网络的新规范,复杂性也随之而来,对增强可视性的需求也日益增长。在提供全网遥测的 Cumulus NetQ 之上,故障快照WJH 在逐个交换机上以线速收集所有端口数据包信息。客户将故障快照 WJH 和 Cumulus NetQ 结合使用,提供故障数据包信息和全网遥测信息,在整个网络Fabric结构中实现更深入的可视性,可以更好地了解整个网络。”

Western Digital 数据中心系统业务部产品管理高级总监 Scott Hamilton 表示:“NVMe over Fabrics™ 作为下一代可组合/解耦基础架构 (CDI) 的基础— 可在此架构中为特定的应用程序工作负载有条理且动态地配置计算、网络和存储。像 Mellanox 的 故障快照WJH 这样的工具会非常有用。在 CDI 中,这些高度可扩展的池(包括 OpenFlex™ 存储平台),必须可跨网络Fabric访问,并能随时随地根据需要提供资源。因此,了解网络性能和带宽瓶颈,并优化设置以实现最低延迟和最高性能,快速定位故障问题,对于满足数据密集型应用和数据驱动环境的需求至关重要。”

Excelero 的首席技术官 Yaniv Romem 解释到:“Excelero 和 Mellanox 共同致力于帮助以太网存储矩阵(ESF)客户充分发挥其 IT 系统的最大潜能,而全新的 Mellanox 故障快照WJH技术 让这一目标更易于实现。我们很高兴能在跨任何网络共享 NVMe 闪存的 NVMesh 解决方案中,利用 Mellanox 的 故障快照WJH 先进可视化功能。借助 故障快照WJH,在解决那些大家熟知的难以重现的异常情况方面,我们节省了大量时间,确保了存储访问始终如一的低延迟。”

Apstra 的首席营销官兼产品副总裁 Michael Wood 表示:“Apstra 基于意图的数据中心自动化提高了应用程序的可靠性和可用性,简化了部署和运营,显著降低了企业和云服务提供商的成本。Apstra 开创了基于意图的网络。单一事实来源和实时验证加上基于意图的网络分析,可以用来持续监控、衡量和识别与原始意图、设计和期望的偏差。Mellanox 故障快照WJH技术能够利用硬件加速遥测,该技术可作为 Apstra 基于意图的网络的一部分,以进一步增加跨数据中心基础架构收集、处理和分析的信息的数量、粒度和深度。”

Dell’Oro Group 的高级总监 Sameh Boujelbene 表示:“计划外的数据中心中断每年会造成数百万美元的收入损失。在当今的数字世界中,稳定的网络是可靠业务运营的关键,而只有清楚网络中正在发生的情况才能实现这一目标。  随着数据中心网络性能提升和采用Overlay网络技术(如 VXLAN 和 GENEVE)带来额外的复杂性,网络确实需要更先进的可视性。  先进的网络遥测技术是一项新兴技术,可以用来提升数据中心的正常运行时间。虽然多年来,所有数据中心交换机均早已采用基础的遥测技术,但这种新型的先进遥测技术现已成为网络运营商关注的创新领域,而且我们相信故障快照 WJH 将推动业界对 Mellanox 以太网交换机的需求增长。”

Nimbix Inc. 的联合创始人兼服务交付副总裁 Rob Sherrard 表示:“Nimbix 通过提供专门为这些工作负载优化的云计算技术,加速了 HPC、人工智能和机器/深度学习应用程序。Mellanox 的交换机是我们一流的云计算基础架构的一部分,我们很高兴使用故障快照WJH技术来提高数据中心网络的利用率,同时提高整个网络的可视性。”

Mellanox 将于 5 月 20 日至 23 日在巴塞罗那举办的 2019 年 KubeCon 活动上展示 故障快照WJH 技术。欢迎参观 Mellanox 的 S33 展台,了解内置先进网络遥测技术的 Mellanox 高吞吐量网络解决方案的优势所在。