一旦解决了延迟,数据完整性和带宽利用率问题,就可以产生一个有效的WAN存储方案。
IT具有分布性以及对于灾难恢复和业务连续性的高度关注,这些都驱使如今的企业普遍进行远程数据存储。几乎所有的公司和机构都认识到在其主要的数据中心之外的地点,至少还需要有数据的一个副本。
对于不少公司来说,这个远距离意味着使用点对点的光纤作为数据传输介质,来构建城域网(MAN)。但这个方法仅限于100英里之内的距离,而自然灾害造成的危害通常超过城域的范围。在更远的距离上(即广域网,简称WAN)拓展存储,通常成为必须的。
IT经理也被要求把相距较远的数据中心连接起来,或者被要求把新增加的机构和设施整合到原有的网络中,例如因为收购而增加的设施。这些数据中心可能位于公司总部数千英里之外的地点。
在本文中,我们将介绍如何有效地解决延迟,数据完整性和带宽利用率问题,以便有效地实现WAN存储。
解决延迟问题
延迟是在发送方和接收方之间数据传输的迟滞,并随距离的增加而增加。通常预测延迟的方针是每100英里1毫秒。这样,如果服务器和一个磁带驱动器的距离为500英里,单向的传输延迟就为5ms。但是,一个I/O需要等到磁带驱动器发送响应返回给服务器,才算结束,这样才能确认收到数据。于是,数据传输的实际延迟是一个I/O操作的完整执行时间,在上面的例子中,为10ms。
为了解决写入延迟问题,存储路由器在上一次写结束之前,就把数据块交给存储控制器。这意味着存储路由器以“信任我”的模式同服务器进行交互,所以服务器无需等待来自远程存储设备的实际确认信息,就处理多个写操作。对于读,如果协议允许,存储路由器将在服务器接受到实际的命令之前,提前读出数据。这就确保一旦接收到读命令,数据块已经在网络中了,从而减少了数据传输延迟。
这个“信任我”的模式通常称为“流水线操作”。在流水线操作下,存储路由器负责以合适的顺序发送数据块,同时确保数据完整性。如果数据传输时发生了一个不可恢复的错误,存储路由器就把该情况通知服务器。利用出错信息,多数应用程序可以恢复到最后一次的成功的块传输状态,之后重新进行数据传输。
更多内容,请点击新闻来源