云数据中心时代,如何应对网络运维难题?

云时代数据中心最明显的特点就是虚拟化技术的大量应用,这使得运维管理的对象也在变化。以前的设备都是真实的,位置也是相对固定,管理起来相对直观。而虚拟化技术的结果是将这些资源都“池化”,使得一切管理对象变成虚拟的、可灵活迁移的逻辑存在,资源在数据中心中的物理位置的可视性变得困难。

云数据中心时代,带来了什么样的网络运维难题?

随着云计算和大数据进入落地阶段,新一代数据中心成为支撑云计算与大数据发展战略的关键,但是随之而来的运维和管理问题也成为了摆在管理员面前的一个难题。

云时代数据中心最明显的特点就是虚拟化技术的大量应用,这使得运维管理的对象也在变化。 虚拟化技术的采用能够减少数据中心中物理服务器和设备的数量,并且提供更高的灵活性,从而满足迅速变化的业务要求。但是与此同时,以前的设备都是真实的,位置也是相对固定,管理起来相对直观。而虚拟化技术的结果是将这些资源都“池化”,使得一切管理对象变成虚拟的、可灵活迁移的逻辑存在。资源在数据中心中的物理位置的可视性变得困难。

问题的一个方面就是数据中心的网络配置。数据中心的网络管理人员和服务器管理员之间需要不断的沟通和协调,故障需要及时检查排除、流程需要跟踪时,如何高效管理这样海量的设备和应用?当然需要通过自动化的手段来实现。比如大型的互联网数据中心,一次上架就要配置上千台交换机,管理人员也就几个人,如何保证他们在短时间内完成这一工作,如何进行跟踪和审计等。当某个业务系统面临故障,如何快速的定位到是物理网络还是虚拟网络问题,这些都需要通过自动化的管理技术来实现。

另一方面,网络和服务器的边界也变得更加模糊,这带来了网络及计算资源的协同调度问题。业务的正常运行,不仅取决于在服务器上的资源合理调度,同时也取决于网络连接的合理调度。服务器虚拟化应用中,VM的迁移不可避免地造成了其接入位置的动态性。这就要求物理网络配置能提供随需而动的管理能力,从而才能保证VM对网络的连通性、安全性、可靠性需求。因此,要更好地管控资源,准确定位VM和物理交换机连接关系,解决资源迁移问题,是数据中心管理者同样必须解决的关键问题。打通网络、计算之间的隔阂,实现资源的融合管理和智能调度,将是实现数据中心基于业务调度,并最终实现自动化的关键。

如何应对云计算和虚拟化带来的网络运维难题?

由上可以看到,面对运维难题,管理员急需一套针对于云数据中心的有效系统,通过这个系统,即能够打通网络、计算之间的隔阂,实现物理资源和虚拟资源的融合管理,同时也需要通过可视化的业务发放,最终实现自动化网络运维,从而提高数据中心运维效率。

华为敏捷控制器Agile Controller 正是针对云计算数据中心专业打造的业务平台,旨在为客户构筑简单、高效、开放的云数据中心网络,云网融合,支撑企业云数据中心业务快速发展。

首先,华为Agile Controller能够实现物理网络和虚拟网络的协同管控,以拓扑方式展示物理TOR交换机、物理服务器、虚拟交换机(vSwitch)、虚拟机(VM)之间的从属或连接关系。重点点展示网络资源与虚拟服务器资源的连接,在一个拓扑图中,同时展示物理网络拓扑和虚拟网络拓扑便于网络管理员和系统管理员联合进行故障排查。

其次,在虚拟机迁移的时候,华为Agile Controller能够通过接口获取到VM迁移消息,自动将网络侧数据在源宿TOR之间进行迁移,实现虚拟迁移时网络配置自动迁移。迁移范围支持静态数据(ACL、QoS、VLAN)和动态表项(DHCP Snooping绑定表),与此同时,感知虚拟变更,记录虚拟资源变更日志,实现资源迁移的追踪溯源。

另外,华为Agile Controller还支持TRILL网络简易部署,对于大型的数据中心,一次上架配置多台交换机来组建TRILL网络,如果每台设备部署仍然需要专业人员的人工干预部署,那么难度和成本都将很高,Agile Controller能够简化TRILL网络自动部署,实现真正意义的零配置。首先Agile Controller融合DHCP服务器、Python脚本编辑器、软件和配置文件服务器等多功能模块,控制器内预置典型的脚本和配置模板,简化客户配置。设备加电后自动软件版本及配置文件,网络拓扑自动计算,根据SPINE/LEAF连接关系自动配置TRILL(Nickname和链路类型等) ,自动完成TRILL节点插入。

总结来说,在云时代的数据中心里,IT管理者必须能够时刻了解自身的IT资源情况,随时能够了解虚拟机和物理服务器之间的对应关系,同时清楚地建立起物理服务器、虚拟机、物理网络、虚拟网络之间的关系,并且把这些元素同数据中心的业务系统之间的关系建立起来。而这一切,华为敏捷控制器Agile Controller都能够帮助管理员实现,从而大大减小运维复杂度。