Cloudera助力企业部署现代化数据架构,突破数据隐私挑战

Cloudera大中华区技术总监 刘隶放

随着数据成为数字时代的新货币,企业正积极寻找数据变现的方法。越来越多的企业开始运用AI驱动的分析技术来挖掘客户洞察,以进一步推测客户信息,并希望借此发现新客户群体和市场、优化运营,并降低营销成本。

为此,企业将消费者的敏感数据输入到AI系统中。但是,大量敏感数据的使用往往会造成信息安全隐患。因此,企业在利用数据提升客户体验的同时,也需要承担保护这些数据安全的责任。 

数据治理不当会为企业带来巨大风险,包括声誉、财务、法律和客户维系等方面。因此,数据安全不容忽视。对于数据管理不当带来的声誉风险,具有重要品牌价值的大型企业或金融机构等受到严格监管的企业都会保持高度警惕。IDC预测,到2027年,40%的中国企业将利用AI 来增强隐私数据的安全性。如果企业违反或不遵守法规,就可能导致起诉风险和品牌忠诚度的长期损失。

然而,新一代生成式AI应用的前景与潜在价值,以及企业想要利用的庞大个人数据,似乎都与隐私保护要求背道而驰。企业像是在一场“零和博弈”中挣扎——到底是利用数据升级产品,还是为避免数据隐私风险而让步?

根据Cloudera对 IT决策者的调查,在数据使用方面,一部分IT决策者认为其企业能够打破这一“零和博弈”困局:如果将数据隐私升级为一项核心业务流程,企业就能够更安全地利用数据。

隐私设计

为了将数据隐私升级为核心业务,首先要为数据管理所涉及的人员、流程和技术制定一套规范方法,包括事先在 IT系统和业务实践设计中加入隐私保护措施,避免在事后或出现漏洞时被动应对。

无论是购买、出售还是采集数据,企业都应全面了解其已掌握的消费者信息,包括这些信息如何被检索到、被存储在何处、通过什么方式以及何时被使用或处理、谁在使用或访问这些信息、如何保护这些信息,以及这些信息何时会根据要求被移除或删除。

简而言之就是要掌控全数据生命周期,明确数据采集、管理和使用的准则。同时还需要对这一策略进行评估,确保其符合企业所在市场的隐私法规。在这种 IT环境中,个人数据在从采集、使用到销毁的完整生命周期中会自动受到保护。

无论是查看客户360度视图的营销人员,还是监督供应链库存的团队,该原则适用于那些使用个人数据支持业务用例的数据架构。

恢复数据控制权

为实现以隐私为核心的数据战略,企业可以部署一个现代化的数据平台,以便对其所有数据实施一致的安全控制措施。如果能在各处无缝应用一致的数据上下文,企业用户将能安心处理在各种环境下的敏感数据,减少创新时在安全方面的限制,以带来更大的自由度。

部署开放式数据湖仓一体架构等现代化数据架构可以减少数据孤岛。无论数据位于何处,无论是结构化还是非结构化数据,现代化数据架构都能在这些数据中应用一套完整的安全和治理技术与策略。随着被存储在云或本地中的大量复杂数据以各种方式被访问,落实一致的数据安全策略十分关键。这一基础层包含数据加密或标记化,以及访问、权限和审计管理,还能检测异常情况,并在出现漏洞时及时向 IT领导人发出警报,加强了企业数据和AI环境的威胁防范能力。由于法规涵盖的不只是可用数据,而是所有存储的个人数据,因此,落实一致的数据安全策略至关重要。

在数据治理方面,数据管理平台的安全控制措施提供了可视性、审计追踪和访问控制,以确定数据的访问者和所访问的数据内容、访问这些数据的原因和方式,以及他们对这些数据采取的行动。所以,进行数据治理需要了解数据在整个系统中的移动情况,也称为数据谱系或数据溯源。比如,从哪里采集数据、以何种方式分发数据、谁在何时以及为什么修改数据、他们在哪里移动数据等。

在合理的数据治理后,企业便能够在安全的数据驻留处运行AI模型,同时保护消费者隐私、确保AI部署的合规性,并遵守日益严格的数据法规。最终,企业可以通过具有安全设计的数据管理平台恢复数据控制权。

“鱼与熊掌,可以兼得”

如果企业将数据隐私视为必须遵守的关键业务原则,就可以实现在从数据分析和AI中获益的同时,保护好个人隐私,从而避免了在两者之间进行艰难选择。

数据隐私问题给企业带来的是机会而不是困境。企业可借此机会证明自己对数据隐私的重视态度。这不仅是为了遵循法规,也是一个企业应该做到的。