Teradata天睿公司宣布推出Teradata® Aster® R,通过放宽内存和处理能力限制条件,扩展开源R语言分析能力。Teradata Aster R为R语言分析师提供企业级就绪(enterprise-ready)的商业分析解决方案,具有高度可扩展性、可靠性和易用性。
R语言分析师希望充分利用R语言的优势,但在单服务器环境下部署,且仅在内存运行时,他们遇到困难。因为单服务器内存运行环境限制可在内存处理的数据量,并导致复杂分析性能下降。Teradata在数据库内并行执行R语言分析,放宽处理能力及内存限制。在数据库内运行R语言,可高速处理海量数据,满足企业分析能力需求。Teradata还能帮助R语言分析师从多个数据源访问及整合详细数据,通过更广泛的分析方法获得更准确的结果。
R是面向数据挖掘人员和数据科学家的一种开源统计语言及软件。Rexer Analytics咨询公司调查显示,使用R语言的数据挖掘人员越来越多,70%的调查对象称他们正在使用R语言。
Teradata天睿公司实验室(Teradata Labs)总裁 Scott Gnau 表示:“Teradata Aster R为企业提供R语言分析能力。而针对R语言分析师,Teradata开发出他们熟悉的R语言和工具,并提供强大的处理能力及丰富的分析方法。分析师还能够从多个数据源访问海量整合数据。”
Teradata Aster R采用高性能计算平台,具有安全性、数据管理能力及整体分析能力三大优势。这一全新解决方案包含以下三大组件:
Teradata Aster R Library – 该语言库预置100余种R语言功能,所有数据均支持并行运行,降低并行处理的复杂性。分析师无需花费数日进行并行算法编码,他们可即时访问R语言并行功能,如数据管理、访问、探勘与操作、机器学习算法等。此外,Teradata还通过拥有专利的Teradata Aster nPath™等高性能分析能力,增强开源R语言的分析能力。
Teradata Aster R Parallel Constructor – 该组件拥有超过5,500个R语言分析工具包,且支持所有开源社区开发的新分析功能,可帮助分析师开发并行分析方法。
集成Teradata Aster SNAP Framework™ – 开源R语言引擎已被整合至Teradata Aster无缝网络分析处理框架(Teradata Aster SNAP Framework),可依据分析师特定探索需要,将多种分析引擎和文件存储无缝整合。多种分析能力的无缝整合增强Teradata Aster R的分析能力。借助图表、MapReduce、文本、统计、时序及R语言分析等多种分析功能,数据科学家可仅通过单一程序就能深度挖掘数据。
Teradata还为Aster R语言库添加高性能图表分析模块,支持先前发布的图形处理引擎Teradata Aster SQL-GR™。数据科学家将能够利用图形分析能力,分析社交网络,监测欺诈行为,并运行可信传播(belief propagation)这一专业的可能性建模算法。
决策管理解决方案公司(Decision Management Solutions)首席执行官James Taylor表示:“随着用户迅速接受R语言极其已被证实的商业价值,意味着那些致力于扩展洞察力以增加营收的企业应将R语言加入他们的预测分析战略。采用R语言的企业应依靠厂商提供支持R语言及交付可扩展部署能力的具体方案。”
R语言分析用例
在线流媒体电影供应商必须预测未来收入,采取行动阻止潜在的消费者流失,并提升其视觉体验。电影供应商将该任务分派给R语言分析师,帮助他们了解客户的购买偏好及服务需求。但由于内存及处理能力限制,分析师无法访问并整合所有需要的数据。在单服务器内存环境下很可能无法及时完成分析,因此分析师无法及时响应商业用户的需求。
部署Teradata Aster R帮助分析师打破内存及处理能力限制,他们还可通过R语言控制台,协调整个分析流程。而通过部署Apache™ Hadoop™及Teradata,分析师可在数据库内针对电影元数据、客户搜索、观看历史记录、账户信息等所有所需数据,轻松实现高速分析。基于这些客户洞察,在线电影供应商将能够针对客户服务及防止客户流失作出明智决策。
Teradata咨询服务(Teradata Consulting Services)和Teradata客户服务(Teradata Customer Services)将为Teradata Aster R提供企业级支持及最佳实践。
Teradata Aster R计划将于2014年第四季度上市。