肯睿(Cloudera):运用灵活的跨云混合数据战略,实现深度业务洞察

肯睿Cloudera亚太区首席技术官Daniel Hand

企业在管理数据和从数据中获得洞察的过程面临着诸多挑战。由于越来越多的数据被创建并在多个位置进行存储,采用灵活的混合数据战略对于管理和编排各种不同的数据集则变得至关重要。诚然,单靠技术无法解决以下挑战,但它是解决方案的关键要素,企业必须结合指导原则和政策来应对这些挑战。

挑战1:提高创新力和业务敏捷性

第一项挑战来自于如何提高创新力和业务敏捷性,包括如何实现数据和数据资产平权。这能够帮助企业避开数据关守(Data Gatekeeper),以便更好地利用他们所拥有的数据。

创新的另一个要素是帮助企业快速扩展并向新的市场提供数据产品和服务。如果需要在数据中心建立一个新的分析集群,尤其是在一个新的国家,则往往需要延长周期。在公有云中管理数据和运行分析可以大幅加快价值变现周期,但需要应对风险和运营复杂性。

以近乎实时的方式获取洞察与传统的批量分析方法存在明显的区别。从数据中获得的洞察,其价值会随着时间的推移而减少,因此企业越来越需要通过近乎实时的流处理来增强批处理分析。

挑战2:管理运营风险

第二项挑战来自于管理运营风险,包括企业如何确保在每个所支持的环境中统一、可靠地实施安全政策和控制。

这方面的另一个变量因素是需要在整个数据生命周期中捕获数据沿袭和来源。如果企业无法了解数据来源以及谁在数据生命周期中访问并改造了数据,那么从数据中获得的洞察价值就会降低。

随着所采集的数据量成倍增加,企业越来越需要对数据进行自动剖析、分类和采取适当的控制手段,比如新的数据集是否包含敏感的个人身份信息(PII)数据等;此外,另一个相关的挑战是如何高效地管理和分析高达PB量级的海量数据。

为了应对监管和治理变化,企业还可能需要在不同环境之间安全、高效地移动数据和应用。这不仅包括将数据从云遣返到本地,还包括当平台被监管机构认为缺乏足够的控制手段来应对政策变化时,在公有云供应商之间移动数据。

挑战3管理运营复杂性

最后一项挑战是管理各种数据集和分析工作负载所带来的运营复杂性。若在每个公有云平台和本地均采用不同的解决方案,那么不论是承担运营费用或是维系一支具备合适技能的团队,都会带来沉重负担。这些因素综合起来将引发并增加运营风险,影响敏捷性。

基于以上三项挑战,以下是一些指导原则和政策,以帮助企业在构建强大的数据战略时克服障碍。在考虑采用何种技术时,企业应牢记:在支持混合云、多云基础架构和处理引擎开放生态的同时也应留有余地。这样,在整个数据生命周期便可以部署集成分析服务集,也可以规定安全策略和控制手段,使其在任何受支持的环境中都能统一一致地执行。

理想情况下,该技术应该可以进一步扩展,不但能够支持当前的数据管理和分析需求,还能够支持未来几年可预测的需求。并且,该技术最好是专为云而设计,以实现计算和存储能够独立扩展。

总结

支持数据编织、湖仓一体、数据网格等现代化数据架构的功能继续影响着当前提供给企业的解决方案。因此,企业可以采用一个能够在多种环境中统一管理不同数据集的平台,结合数据湖和数据仓库的统一化,以及支持数据产品、域所有权和自助服务。Cloudera Data Platform(CDP)与其他企业数据平台解决方案的不同之处在于,其能够在整个数据生命周期内借助共享安全和治理结构持续实现这一点。对于帮助全球各大企业制定和实施灵活的数据战略来说,这项能力是不可或缺的。