2024年11月19日——Cloudera宣布与Octopai B.I. Ltd.(Octopai)达成最终协议,收购Octopai的数据血缘和目录平台,帮助企业了解并治理其数据。这项交易将大大增强Cloudera的数据目录和元数据管理能力。
面对快速增长的数据量,企业急需将数据驱动型决策整合到业务运营中。为了将数据用于AI、机器学习和预测分析项目,企业需要制定综合全面的数据智能战略,以便在整个公司范围内找到所有上下文关联、相关且可信的数据。但对于许多企业,特别是那些处理高度监管、敏感和海量数据的金融、医疗、零售和电信行业的企业来说,由于他们需要在不同的混合环境中使用多种数据解决方案中的功能,因此难以看到数据资产的全貌。
SanjMo首席分析师Sanjeev Mohan表示:“随着数据驱动型企业纷纷采用混合分布式数据架构,元数据管理的自动化对于提供统一的自助式数据视图至关重要。统一的元数据战略能够提供数据消费者信赖的分析洞察,还能确保安全、加强治理力度,并提供一致的全数据资产视图。通过Octopai的可覆盖50多个数据源连接器的企业级多层数据血缘,以及自动元数据管理,Cloudera的数据管理、治理和AI能力得到增强,从而实现综合全面的元数据和数据智能解决方案。”
Octopai成立于2016年。该公司利用自动数据映射和知识图,丰富和盘活元数据,提炼出对数据环境的洞察,深入改变了元数据管理的格局。这一点再加上直观的体验和AI Copilots,加速了高质量数据在分析和AI成果中的应用。如今,Octopai的头部企业客户不仅节省了进行变更或影响分析的时间,还减少了数据运营中的错误和成本,同时能够遵守不断发展变化的法规。
Octopai拥有适用于各种复杂数据环境中的数据血缘、数据发现、数据目录、映射和影响分析自动化解决方案,能够与Cloudera的现代数据架构战略珠联璧合。凭借Octopai的内置元数据管理和多维数据血缘,Cloudera客户能够获得大量数据解决方案的可见性,从而利用可信数据为其AI、预测分析和其他决策工具提供支持。通过Octopai数据血缘和目录平台,客户可以获得以下方面的改进:
- 数据可发现性(Data Discoverability):在各种云、本地和混合环境的复杂分布式数据集中快速找到相关数据,了解数据来源及其可靠性。对数据源、历史和转换的清晰可见性可确保决策基于准确、可信的数据。
- 数据质量(Data Quality):追溯数据从来源到当前状态的过程。凭借Octopai,客户可以解决导致数据不可靠、决策失误和数据产品不达标的数据质量问题,确保整个企业的可信优质数据得到充分利用。
- 数据治理(Data Governance):Octopai可以将各系统的数据自动映射和编目到知识中心,并深入洞察数据流、转换和流程,从而帮助企业客户遵守 GDPR、CCPA、HIPAA等法规。
- 迁移协助(Migration Assistance):通过应用合作伙伴驱动的血缘和Octomize AI生成式AI智能体,可以帮助数据团队降低风险、减少错误,并确保迁移数据在新环境中的准确性、一致性和可用性。
Cloudera首席执行官Charles Sansbury表示:“企业在利用数据进行关键业务决策时,任何盲点或错误都不能出现,当然也不应让识别可信数据阻碍进度。我们的客户需要在多个存储库中自动发现数据,显示Cloudera内外环境资产的深层数据血缘,并利用强大的数据目录识别可消费的数据资产。收购Octopai平台增强了Cloudera 的数据、分析和AI平台,支持客户无论使用哪家数据管理提供商,都能获得更高的数据可见性。”
Octopai首席执行官Yael Ben Arie表示:“Cloudera和Octopai通过结合集中式数据和元数据管理,创造了一种共生关系。了解并治理不同多云和本地环境中的数据是一项重大挑战。为应对这一挑战,我们将Octopai的元数据功能与Cloudera全面的数据、分析和AI平台相结合。此次收购将使Octopai 数据血缘和目录平台成为元数据管理的标准,同时加快Cloudera支持客户迈入AI时代的速度。我们十分高兴能大规模为客户带来企业级数据血缘和元数据管理能力。”