2022 年 6 月 7 日, Micro Focus 旗下的统一分析平台 Vertica 在年度 Unify 大会上正式发布 Vertica 12。该全新版本囊括了高级分析、机器学习及混合部署等等面向未来的数据库先进能力,标志着统一数据分析迈向新高。
Vertica 12,面向未来的分析
飞驰旋转的数字世界,正以独特方式定义着全新的数据生态。这一变革的增速史无前例,有相当一部分企业将成功驶入“超车道”,远远超越过去数十年积累的总和,但也有一部分企业可能就此落入发展差异的缝隙之中,在新战场败下阵来。诚如 Micro Focus 高级副总裁兼 Vertica 总经理 Scott Richards 所言:“即便很多公司已经决定了他们的分析战略,但没有人确切知道未来将会发生什么,无论是选择公共云、私有部署还是混合环境部署,都会面临同一窘境。”
无论黑马之喜,抑或黑天鹅之忧,若眼光只局限于脚下,都不可避免被淘汰。再辉煌的历史,都是由无数个过去共同缔造的。而 Vertica 正是这样一种放眼未来的分析数据库产品,它脱胎于超越当下的眼界,为未来而生。“通过 Vertica 12 这一灵活全面的分析平台,客户可以实现各大分析策略的无缝集成——既能以 SaaS 模式利用,也足以赋能内部部署。而 Vertica 不竭的创新也意味着,无论您未来的数据战略是什么,它都能为您实现强大的分析力。”Richards 承诺道。
全新的 Vertica 12 在高级分析与机器学习等方面拥有更广泛的增强能力,以及跨多云、企业内部和云等混合区域的部署能力等,以方便用户从市场上相对广泛的部署选项中进行灵活选择;其经过优化的自动化能力,足以使企业的分析工作负载适应不断变化的技术需求。
除了支持更多企业内部的对象存储之外,Vertica 12 还将对 Kubernetes 的支持从 AWS S3 扩展至谷歌云存储(GCS)、Azure Blob 存储和 Hadoop 分布式文件系统存储(HDFS),成功兑现在任意环境中都能全面实现云原生的承诺。关于客户密切关心的云,它针对云优化的架构将通过增强智能子集群,帮助所有者更好地管理可变工作负载和数据共享,合理分担使用成本。而在数据集成方面,Vertica 12 更是升级了与主流分析生态的合作互动。客户将大大受益于与专有/开源技术的无缝集成能力,包括新版本的 VerticaPy 库(Vertica Python 和 Jupyter Notebook 的接口)、增强的 Spark 连接器和扩大的 PMML 支持等。
Vertica 12 ,统一分析强引擎
作为全球前七大企业软件公司 Micro Focus 旗下的核心大数据分析平台,Vertica 从诞生之初就蒙上了光环——数据库大师 Michael Stonebraker 博士亲手创造了它,并推动成为当时最高水准的列式商业系统,站上列式数据库商业化新高度。
经过 17 余年的精心打磨,Vertica 更作为众多数据专家、转型领军企业以及广大数据库从业人员的心血结晶,正式蜕变为面向高性能而设计的统一分析平台,服务包括中国电信、飞利浦、萃奕(The Trade Desk)与美国万通等世界知名的数据驱动型企业。此次发布的最新版本更将其能力范畴大大延展,从部署能力、性能支持、高级分析与机器学习四大方面入手,将业内先进技术有机集成至产品核心,轻松应用于苛刻的大数据分析挑战,从而真正打造出业界独一无二的统一分析强引擎。主要更新包括:
更广泛的部署框架与更高的性能支持
扩大内部对象存储列表 – 随着 VAST Data、新华三两大存储商与 Dell、MinIO、NetApp、Pure 和 Scality 等一起被添加至 Vertica 兼容的内部对象存储列表中,12 将支持更广泛的用于实施私有云的对象存储数据库
云原生、弹性力和容器化无处不在。12 针对云优化的改良架构,提升用于数据 ELT 过程和数据摄取的子集群效率
增强 AWS S3 的数据共享,新设置“使用者付费”的新消费模式
快速自动化分割大型的未分割表
加速 Parquet 文件分析,完善对复杂数据类型的支持
Vertica Accelerator 全面 ISO-2001 认证,Vertica 统一分析平台将以 SaaS 形式交付(中国区暂未上线)
支持 FIPS 和更多认证。12 扩大对单点登录(SSO)的支持,并为 JDBC 和 ODBC 客户端提供 OAuth2 令牌认证
更强大的高级分析和机器学习
新增用于 Python Pickle 的 VerticaPy 功能和增强的 Graphviz 包
增强数据库内分析能力,比如库的扩展、更多有用的地理空间功能
端到端的机器学习能力,帮助用户在 Vertica 平台上管理、操作从其他地方创建的树形模型等
优化存储程序,包括对几何、地理学和现有流程的新拓展
加速就地分析,帮助用户分析在对象存储或 HDFS 上多种格式的数据
Spark 连接器,新增对经 Parquet 或其他 HDFS 和 S3 系统的数据交换的支持
新增应用开发者生产力分析,通过对 NODE.JS 的支持实现