SAP HANA应用与需求的那些事
袁家驹 发表于:13年05月24日 13:48 [原创] DOIT.com.cn
在这个大数据的时代,数据库软件需要应对当前企业里不同来源的海量数据,并将这些不同结构的数据进行整合,进一步实时进行数据挖掘和分析。所以主打ERP软件的SAP公司肯定也会做出应对高性能的大数据分析软件来满足这一巨大的市场需要。
在2010年SAP全球技术研发者大会上,SAP公司发布了SAP 高性能分析应用软件(SAP High-Performance Analytic Appliance ,简称SAP HANA),2011年则开始将成熟的产品和解决方案向全球推广,目前SAP HANA也是SAP历史上用户增长速度最为迅猛的产品之一。它借助主存储器、处理器技术和应用诀窍领域的最新成果,SAP HANA充分发挥内存数据处理的威力,使分析应用软件获得了前所未有的效能,并由此开启了一个全新的应用软件类别。
SAP HANA应用解读
SAP HANA是一个开放性的开发合作平台,SAP HANA也将成为SAP主要的战略平台。SAP HANA强大的数据处理能力尤为突出,SAP HANA在0.036秒即可装载32亿条记录,0.031秒筛选出8000万条数据并完成信息汇总。SAP HANA使海量数据运算进入毫秒单位级,将原先需要几天甚至几年才能完成的计算过程,在几秒钟内完成,并给企业提供最精确的信息。这使得更多企业开始使用SAP HANA来处理大量数据。
SAP HANA可以快速解决大量数据主要是因为它所采用的数据字典处理方式。尽管今天的内存容量允许把大量的数据存储在内存中,把数据进行压缩的目的没有直接用来提高性能,但把内存数据进行压缩还是可取的,它可以最大限度的减少数据从内存传输到CPU cache中。SAP HANA采用数据字典的方法对数据进行压缩,用整数来代表相应的文本。数据库可以压缩数据和减少数据的传输,从而达到快速处理数据的目的。
还有在数据库处理方面,SAP HANA把应用逻辑和计算由应用层转移到数据库层。传统数据库中,一个应用程序在处理应用逻辑数据时,先把数据从数据库读出来,然后再进行相应的计算处理,最后处理后的数据写回数据库中。在数据库和应用程序传输数据包括在一个网络通信,那么网络资源的开销,延时,传输速率及最大吞吐量都对它们之间的通信会产生限制。如果数据库能够执行计算和应用逻辑,不需要将数据发送回应用程序甚至可能减少数据交换的需要。这可以最大限度地减少传输的数据量。
其实SAP HANA目前最大的应用就是在其速度上质越的提升,但如果说SAP HANA的作用就是加速的话,那也是大错特错的,SAP HANA的应用目前还是很雏形的,不过SAP HANA的潜力是非常巨大的。首先,BW可以做的,SAP HANA其实是可以独立完成的,而且,BW还可以运行在SAP HANA之上。SAP HANA提出的理念是以纯内存的储存运算,大大的节约了从内存到硬盘,再从硬盘到内存这个数据调用的时间。SAP HANA把硬盘上储存的东西,放到内存中运算,因为内存的访问速度比磁盘快1,000,000倍,传统磁盘读取是5毫秒,内存读取是5纳秒。比SSD和闪存还要快1000倍。HANA是一个平台,我们可以大胆的设想,将来可能有更多的运算建立在SAP HANA之上的,这些都是有可能的。BW ON HANA目前也已经正式的投入实施使用中。
总的来说,SAP HANA提供了一种新的大数据处理的理念,就是选择内存并行运算,从而省去了硬盘的读取时间。SAP HANA目前的效果还是不错的,相信SAP HANA在以后会更高速的处理更大量的数据。因为SAP HANA还在不断的开发当中,所以要想了解更多关于SAP HANA的信息还需要更多的学习。SAP目前在国内也有着很多的培训机构,如果真的对此很有兴趣可以学习一下。