2017年10月16日,北京 – 为云计算优化的机器学习和分析平台供应商Cloudera(纽约证券交易所代码:CLDR)近期宣布推出Cloudera SDX。Cloudera SDX是一种模块化软件框架,能够让企业获得“共享数据体验”。通过将集中、一致的框架运用于schema、安全、管控、数据获取以及其他用途,SDX使得数十种不同的客户应用能够基于共享或者重叠的数据组运行。SDX降低了多功能数据应用的开发难度和部署成本,提高了应用的持续安全性。Cloudera SDX现已面向采用Cloudera企业版的客户推出。
要想应对如今众多的高管级挑战,如网络安全、互联产品和服务、提高用户的终身价值等等,需要各种复杂的应用共同协作。举例而言,物联网应用通常涉及数据获取、实时分析、批量机器学习以及流数据。新一代最佳平台集机器学习和实时处理于一体。在很多情况下,这些多功能应用集群要么在云计算架构上运行,要么依赖于云所产生的数据。
开发并交付这些复杂的应用对于内部数据中心的多租户集群而言是一项艰巨的挑战,在云环境中更是十分困难,因为数据上下文和策略不在瞬时环境里存留。此外,大部分云计算服务实际上都是在隔离的集群中运行的孤立应用。
SDX使用户能够创建、管控、管理这些多功能、高价值的分析应用并且保障其安全。此外,SDX还支持集成并且进一步增强平台功能的、经过Cloudera认证的合作伙伴解决方案。
Cloudera SDX的一个关键组件是共享数据目录,通过该目录可以实现持续安全、管控以及管理功能,并且可将其用于长期运行以及瞬时分析应用。此外,该共享目录还允许自助访问业务数据,因为已经不再需要IT重新创建上下文、控件或者每个新用例 。
Ovum公司首席分析师Tony Baer表示:“企业经常将安全、管控以及复杂性作为其不愿意将其操作型工作负荷转移至云端的主要理由。Cloudera通过内置安全和数据管控功能,使企业能够满怀信心应对其生产环境中的大数据工作负荷。Cloudera SDX建立在企业的IP上,具备跨云环境和内部数据中心的共享数据体验 。”
Cloudera SDX帮助企业解决以下关键挑战:
孤立数据——云端自助集群不是天然就共享数据和元数据,因此单独的集群就变成了事实上的孤岛。通过在按需应用和瞬时集群间共享一致的数据和元数据,Cloudera的客户可以保持敏捷性,确保每个孤立的集群不需要单独控制和管理,也不会产生额外的数据复制和存储成本。
安全漏洞——由于没有集中的安全控制,管理员不得不针对多份孤立数据持续反复运用安全和访问政策,产生了额外的工作量并且增大了敏感信息泄露的风险。有了Cloudera SDX之后,安全性持续在数据层面得到保障。安全策略普遍存在,当数据在新的分析应用中移动或者使用时,无需加以变更或者重新运用。
治理挑战/不合规——应对如今的HIPAA和 PCI-DSS合规以及潜在的GDPR要求,共享数据和元数据目录必不可少。有了共享数据目录,就能够很容易迅速找出并且理解数据上下文,实现自助应用,并且提供可靠的审计和数据沿袭功能。
以下功能即将于下月在Cloudera 5.13上推出,增强云计算环境下的SDX功能:
多集群目录,是一种基于共享Amazon RDS或Azure用户共享MySQL的Hive元存储,用于存储和管理数据上下文。
多集群Cloudera Navigator功能,使得用户能够更容易发现数据并且管控数据访问,满足审计要求并且理解数据沿袭。
多集群Sentry安全许可及政策,提供详细、基于角色的共享数据访问控制。
不同地方的集群采用同一Cloudera Manager界面,从而简化操作并且增强数据验证功能。
从内部数据中心集群备份和容灾到Amazon S3。
Cloudera创始人兼首席战略官Mike Olson表示:“Cloudera 企业版能够加速数据科学、机器学习和分析,SDX是Cloudera 企业版的秘密武器。数据是世界上最宝贵的资源,是推动深入洞察,驱动机器并且化不可能为可能的源动力。从成立伊始,Cloudera就致力于帮助企业从其数据中获取价值。无论是对于IT还是业务用户,Cloudera SDX都简化了这一使命。”
用户和合作伙伴的心声
Trifacta公司产品副总裁Wei Zheng表示:“SDX为成功部署和管理现代分析平台提供了一系列强大的功能。用户利用Trifacta将原始数据进行再加工,得出清洁数据,然后进行分析和机器学习。在这个过程中,他们产生了大量的元数据,这些数据对于企业的数据控制工作极富价值。Trifacta与SDX相集成,将让双方共同的用户更为有效地管理元数据,并且将其提供给不同的利益相关者用于安全和控制,我们对此深感欣慰。”
StreamSets首席执行官Girish Pancha表示:“SDX是又一个创新,通过提供共享服务,简化企业数据安全和控制,为我们共同的用户创造更多的价值。StreamSets屡获殊荣的数据获取平台不仅读取,而且也写入业务和技术元数据目录。因此,用户可以打破数据孤岛,为最终用户提供更好的数据服务等级协议,从而通过Cloudera更高效、有效地分析数据。”
Dignity Health公司系统副总裁兼首席医疗信息官Joseph Colorafi博士表示:“借助Cloudera平台,我们的Sepsis Biosurveillance工具能够提前对病人进行早期疾病检测,显著降低了死亡率。Cloudera SDX让我们能够运用一致的控制和安全策略,包括静态和动态下加密、授权、验证并且完全遵守HIPAA合规要求。”
Cloudera SDX支持多个公共云、私有云以及裸机配置,并且可供拥有Cloudera 数据科学和工程版本、分析型数据库版本、操作型数据库版本或Cloudera 企业数据中心版本许可证的用户使用。更多详情,请登录cloudera.com/sdx。