北京,2022年10月17日——Cloudera发布多项全新混合数据功能,使企业能够更高效地跨云和本地移动数据、元数据、数据工作负载及数据应用,优化性能、成本和安全性。
Cloudera的可移植数据服务支持简单、低风险的数据工作负载和数据应用移动,以实现终极数据湖仓选择。Cloudera统一数据编织中的最新SDX增强功能能够使安全数据复制简化并保护数据与元数据的移动。Cloudera通用数据分发提供了第一个为混合数据构建的数据摄取解决方案。这些新功能是企业通过数据优先策略控制混合数据的关键,能够正确处理数据的企业就可以不受限制地访问和分析数据。
Futurum Research创始合伙人兼首席分析师Daniel Newman表示: “随着数据持续成倍增长,企业必须找到在日益兴起的混合云和多云环境中实现快速业务转型的关键工具。Cloudera在处理大型、复杂的数据量方面拥有丰富的经验,包括在监管和法规最严格的行业。通过这些更新,Cloudera正在进一步提升其作为数据优先企业的领导地位,运用人工智能(AI)、机器学习(ML)和混合架构来推动业务发展。”
Cloudera亚太和日本地区副总裁Remus Lim表示: “亚太区的企业需要拥有能够将数据转化为战略性商业资产的工具,以成功应对当前的变化和未来的挑战。随着越来越多的企业采用现代化数据架构,快速使用本地和云端数据的能力变得至关重要。当跨越各种混合基础架构时,能高效、安全地在各类应用和工作负载之间移动数据将是未来取得成功的关键。”
企业从本地、云和流式传输地点中采集和存储的数据量正持续飙升。根据Statista的预测,到2025年,全球产生的数据总量将达到180ZB以上。这便是混合数据带来的挑战,经济和市场进一步迫使企业机构以更快的速度从数据中获得洞察。此外,业内专家一致认为,大规模掌握数据是利用机器学习和人工智能推动持续业务转型的唯一途径。Cloudera针对混合数据的全新数据分析和数据管理创新专为帮助企业跨数据中心和公有云大规模数据管理而构建,可帮助企业实现机器学习和人工智能业务转型。
Cloudera首席产品官Sudhir Menon表示: “企业需要兼顾成本与性能,尤其是随着他们转向混合云、多云环境,这两个方面已密不可分。选择数据优先战略的企业可以专注于如何交付价值,而不仅仅是如何花钱。要做到这一点的关键是能够在整个现代化数据架构中随时随地移动数据和工作负载,以便满足不断变化的业务需求。Cloudera一直在混合云中提供一致的数据安全和治理。通过这些更新,Cloudera将能够在所有基础设施上的数据服务之间做到这一点。”
针对混合数据的全新Cloudera数据分析和数据管理创新包括:
可移植数据服务
可移植数据服务使数据分析及使用数据分析构建的数据应用能够在不同基础设施之间快速、高效地移动,而且无需成本重新开发或重新构建数据应用。CDP数据服务(包括数据工程、数据仓库和机器学习)均建立在统一的代码基础上,并且在AWS、Azure和本地私有云上提供相同的功能。通过使用在不同云中以相同代码运行的数据服务,用户、管理员和开发人员能够更容易地将数据转化为价值和洞察。无论数据存储在何处、数据应用在何处运行,用户都能获得相同的数据体验,包括相同的数据分析功能、相同的Cloudera SDX安全性和管理,并且这些体验专门为了与首选云上的云原生存储一同无缝运行而量身定制。Cloudera能够提供真正的混合数据分析,使企业机构能够轻松地跨云移动数据工作负载和数据应用,优化性能、成本和安全性。
安全数据复制
安全数据复制使数据和元数据能够在数据中心和公有云中的各种Cloudera部署之间快速、安全地复制或移动。数据的创建地点往往与需要它的地方不同。安全数据复制由Cloudera SDX最新添加的服务复制管理器实现。Cloudera的复制管理器能够将携带数据安全和治理策略的元数据随数据移动到任何地方,因此无需重复实施这些策略。作为一项数据移动服务,复制管理器通过一个简单的策略驱动界面,将数据和元数据从本地实时移动到云或从一个云实时移动到另一个云,最终实现混合数据的灵活性。
通用数据分发
通用数据分发使企业能够以一种简单、安全、可扩展和具有成本效益的通用方式控制从起始位置到本地和云中所有使用点的数据流。通用数据分发由首个为混合数据构建的数据获取解决方案——Cloudera DataFlow实现。不同于笨重、针对特定系统、基于向导的连接器解决方案,Cloudera DataFlow通过450多个连接器和处理器在由数据湖、湖仓、云仓库、本地和边缘数据源等组成的混合云服务生态中提供无差别的数据分发。Cloudera DataFlow是一个真正的混合数据获取解决方案,可满足数据移动用例的全部多样性,包括批处理、事件驱动、边缘、微服务和连续/流式传输。Cloudera DataFlow将流式传输放在第一位,它将任何数据源变成数据流、支持流式传输扩展并解锁数十万个数据生成客户端。