天睿公司显著降低存储和处理海量关系型数据的成本

Teradata天睿公司发布具备更快处理速度与大规模存储能力的Teradata巨量数据专用平台(Extreme Data Platform)1700。针对大数据,该平台能够提供最佳的SQL引擎以及业内最具竞争力的价格。

每个行业产生和存储的数据量已经从数百TB激增到数百PB的规模。大量的关系型数据通常未被加载(offloaded),而有时甚至被丢弃。为实现分析,企业需要快速和轻松地访问详细的历史数据,而非数据样本。为满足这种需求,业内创造了新兴的SQL引擎集,但仍然不成熟,缺少性能、安全和全面的功能。相反,Teradata巨量数据专用平台可以利用低成本存储允许客户利用所有数据,无需牺牲分析的可靠性。

Teradata天睿公司实验室总裁Scott Gnau表示:“在Teradata巨量数据专用平台1700之前,那些寻求单位TB成本低于5000美元解决方案的客户,将不得不转向文件系统或者减配功能的解决方案。我们全新的平台突破了这一成本限制,同时能够提供最佳的SQL引擎用于大量的关系型数据分析。”

Teradata客户曾在Teradata巨量数据专用平台以及Hadoop集群中完成了流行的基准测试Terasort。该基准测试的目标是用最快的速度完成单位TB数据的排序。Teradata巨量数据专用平台以低于20秒的速度完成了基准测试,而Hadoop集群则耗时60秒。尽管Hadoop集群拥有8倍于Teradata的服务器数量,但是Teradata的速度仍然快3倍。该基准证实了在数据排序中Teradata平台的性能优势。除了高性能,客户将从该数据库的高级功能中获益,而这些功能将适用于所有数据的复杂分析,包括:分析、安全、优化、索引以及工作负载管理。在评估解决方案的可行性中,上述例子重申了考虑交付成果的整体拥有成本(TCO)的重要性,而非廉价通用服务器的成本。

除了适用简单和复杂任务的极致性能,Teradata能帮助企业在更少的空间中保存更多的数据。在客户实际部署中,Teradata巨量数据专用平台较一般通用系统(commodity system)节约高达15倍的数据中心空间。此外,该平台还能扩展至存储556PB的压缩数据。

PayPal公司数据副总裁Sam Hamilton表示:“Teradata巨量数据专用平台1700改变了存储和处理数据的成本。除了Hadoop,PayPal使用了大规模的Teradata平台以高效分析结构化和半结构化数据,获得高价值的客户行为洞察力来支持我们的业务决策。”

Teradata巨量数据专用平台兼容通用的分析和业务智能应用,具备高性能,能够轻松处理商业用户提出的大数据分析查询。Teradata巨量数据专用平台配备Teradata数据库,属于企业级平台,能够提供Intelligent Memory、整合负载管理、最佳安全性、兼容ACID原则(原子性、一致性、独立性及持久性),并提供标准ANSI SQL兼容性(美国国家标准学会)等。

全新改进

Teradata巨量数据专用平台配备3TB的存储驱动器,成为更加经济的存储选项。同时,可选热备节点和冗余驱动器增强了系统可靠性,而改进的数据存储架构更好地保护了数据。该平台搭载2颗主频高达2.6GHz 的Intel® Xeon® Sandy Bridge 8核处理器,运行同其他Teradata平台相同的Novell® SUSE® Linux Enterprise Server 11软件。

深度分析

随着信息量增加,执行深度分析的能力也在增加。在应用中,Teradata支持航空行业需求。该行业需要具备存储和分析机器生成数据的能力,以更好地了解维护和修复需求。例如:

● 在飞行中,一架飞机的单台引擎每30分钟产生的数据量会高达10TB;

● 一架双引擎飞机从纽约飞往洛杉矶将产生高达240TB的数据,而将该数据量乘以天空中同时飞行的30,000架飞机,那需要存储和分析的数据量将会暴增。

其他需要Teradata巨量数据专用平台的存储和分析能力的行业应用案例,包括:

● 网页分析:分析整合的点击数据流以促进商品销售

● 法规和遵从:详细的多年历史数据以满足法规遵从,如政府要求的合法扣留等

● 传感器数据:配备RFID的产品位置移动和监测

● 通信网络:数据分析将使得客户能够评估客户行为、网络、基站塔和手机性能;满足法律对保存数年历史记录的要求

● 保险精算分析:通过分析大量不同客户的特征,保险公司将能确定客户的风险

Teradata巨量数据专用平台1700目前已经正式出货。此外,将于2014年初具备收集和分析JSON数据的能力。

统一数据架构(UDA)

存储在Teradata巨量数据专用平台的数据使用相同的Teradata格式和schema,能够轻松在Teradata整合数据仓库之间迁移。这些特性使得该平台能够无缝集成在统一数据架构(UDA)中。Teradata统一数据架构是企业分析多个Teradata系统中所有类型数据的单一框架,应用了Teradata数据库、Teradata Aster数据库以及Apache™ Hadoop®的互补优势。