超大规模网络架构管理需求愈发凸显
佚名 发表于:11年12月16日 16:00 [来稿] DOIT.com.cn
若超大规模存储网络像城市交通一样去进行粗放型管理的话,其结果有多么恐怖完全可想而知。交通堵塞,延迟和数据丢失……网络架构管理与道路交通管理不同,它具备实时流量监控和用于故障排除的端对端视图功能。
不过我们要考虑到任务的难易程度。若一个网络有800个服务器和网络适配器,300个交换机,2个控制器和50个存储阵列,还有1150个网络设备和超过5000个的网络端口-这种规模并非具备云标准的特殊超大型网络架构所独有-市面上常见的架构管理系统同样可以轻松扩展到9000个交换端口和20000个终端设备。在这种情况下,我们根本无法通过监控屏幕中的状态信息来搞定全部设备及端口的问题,更不用说进行故障排查了。
这项工作相当复杂。我们首先要对这个网络进行路径配置,并建立域,还要尝试创建不同的流量策略并确保网络资源的合理运用,避免低优先级应用占用高优先级应用的流量资源。
如上所描述,这样的网络就需要智能网络架构管理系统了。事实上我们几乎可以断言,如果没有这套系统,上述网络完全无法加以管理。
它们也没有足够的监控设备和网络端口。网络是一个单一的实体,并提供了服务器应用、存储阵列和外部服务之间的数据传输服务,还有管理系统应监测服务级别和进行端到端的管理。
端到端
让我们还回到那个城市交通的比喻上,端到端的监控就像是监测纽约大中央火车站和Laguardia机场之间的道路一样。也许这样的比喻有点可笑,在市区或是城镇中进行端到端的监控是不切实际的。然而同样的监控手段却是数据网络正常动作的必备条件,没有它的话,我们将无从搞清设备故障到底影响到了哪些网络服务项目。
通过像思科Fabric Manager和博科的数据中心网络架构管理系统(IBM的OEMed)这样的产品,你可以自定义网络架构中端到端的流量监测规则。它们可以对流量和网络通信时间之类的数据进行实时记录,这些统计数据可以保存到历史记录当中。
博科DCFM界面
这个系统也可以监控单个设备,如果设备的使用频率超过了设置的初始值,它就会发出警报。通过这个软件我们就可以及时管理调试这些设备,比如交换机和交换机端口,还有网络架构中的应用服务和需求响应什么的都可以查看到。如果某项端对端服务开始出现故障,那么立即会有相应的单独设备信息被发送到管理人员手上;该信息将在识别交换设备问题、寻找服务失败原因以及之后的补救方案实施方面带来发挥巨大的作用。