IBM希望将大型机用于机器学习

systemz-200x200

虽然人们一直在强调大型公有云、商用系统加速器在X86系统上的应用,以及开源工具的崛起,但事实上,大型事务处理与分析业务仍然在走另一条路,也就是大型机。这些全面集成,优化的系统大多数用于银行,保险,零售,运输,医疗保健等领域中最大企业的最关键数据处理。

凭借绝佳的内存带宽,I/O,以及强大的内核和可靠的安全性,大型机仍然是全球排名前1000家企业中很多企业关键业务操作的至高选择,这是毋庸置疑的。当然,我们还要谋算与权衡,大型机的成本和灵活性是主要问题,但外部世界的开源正在将新的思路推向一个既定领域。

投资大型机的公司有理由继续前行。大型机针对事务处理进行了高度优化,能做到和系统一样安全,多年来一直是代码投资中数百万美元的项目。当然,大型机不便宜,也并非将大量的关键业务应用程序迁移到一个新的架构。可能让一家大型企业这样做唯一的情况就是大型机被认为缺乏功能和选择——大型机用户更青睐相对的安全性。

虽然大型机的势头依然强大,但喜欢商用X86群集的用户却缺乏灵活性。这些用户可以以一种更加无缝,灵活地方式自由地横向和纵向扩展,集成最新的开源框架用于分析,并继续扩展这些操作。大型机用户采用较新的开源框架的速度相对较慢,可能给X86商家带来一定的竞争优势。

为了克服灵活性的差异,IBM开始努力将机器学习组件从Watson AI框架带到大型机上。IBMx宣布IBM将Apache Spark用于大型机——依靠Spark作为引擎提供机器学习功能,因此用户可以在系统上进行机器学习(对比将其从用于不同分析的盒子里移出)。IBM分析副总裁,Rob Thomas称,这为大型机打开了一扇新的大门。他以Argus Health Systems为例表示,该系统管理了许多医务人员,但与其团队通过以固定时间间隔运行的更为静态的分析不同,团队现在可以获取关于患者和医务人员的持续变化更新,这些更新可以快速反馈到模块里,然后重新运行使用最新组合数据的新成本评估。

因为支持这样的事务系统需要许多强大的统计分析工具,所以人们可能认为大型机已经在采用机器学习问题上有过深思。然而,如果这些工具和机器学习之间的区别正如我们所知代表了不断更新数据和模块的能力,就另当别论了。

“过去几年里我们所看到的数据科技革命一直受开源驱动。就开放式框架和在大型机上访问数据而无需迁移的能力而言,我们正在将这场革命带入到大型机。考虑到大约90%的全球最有价值的企业数据都位于企业防火墙后的大型机和私有云中无法访问,我们必须努力带来同样的开放性。”

为了响应五年前的“大数据”新浪潮,IBM推出了一款大型机辅助设备(sidecar appliance),专为大规模分析设计,不强制要求用户将其宝贵资料迁移出大型机架构。将现代UI(用户界面)和传统BI(商务智能)的感觉带给大型机,吸引用户兴趣,让它们知道大型机可以在不牺牲安全的情况下做得更多,而且也导致对与其它语言,工具和框架的更多开放连通性的需求不断增长。Thomas表示,公司推出Linux功能时,也开放了采用开放源代码世界的新框架的竞争环境,但因为安全问题,用户对将z/OS数据迁移到分区的Linux会有所迟疑。

z系统大型机现在将允许其用户采用几种非大型机面向的语言,包括Scala,Java和Python,还涉及一些开源机器学习框架,包括SparkML,TensorFlow和H2O。Thomas表示这些工具可以找到任何保存在系统上的数据类型,让用户不再担心为了较深入分析而从大型机迁移到不同系统的数据。考虑到大型机每天可以处理超过20亿次交易,数据单独传输就会引人注目。

虽然IBM的重点已经放在大型机上,但它将这相同的一套功能扩展到了采用私有云的用户中。在这两种情况下,Thomas强调,虽然公司已经从Watson提取了一些基础机器学习技术,但这些客户终端正在向AI过渡——差异是与数据更加人性化的交互与机器学习的高级分析。