5月8-10日,中国数据库技术大会DTCC2019在北京举行,钻石赞助商浪潮在大会上展出了数据库一体机inData系统,该系统是一款成熟的HTAP方案,适合于海量事务实时处理与数据实时分析的混合负载业务场景,可以处理PB级数据量,解决了大型企业数字化转型中的数据挑战。
企业数字转型的数据挑战
DTCC是中国数据库和大数据领域规模最大、最具影响力的技术峰会,本届大会的主题是“数据风云 十年变迁”,会议议题集中于过去十年的数据库互联网化演进以及未来的发展趋势。在过去的十年中,传统关系型数据库产品一直在不断采用互联网技术,以应对企业日益增长的访问压力和数据量。据IDC预测,2020年,全球数据量会达到44ZB,2035年会达到1.9万ZB。
浪潮inData产品负责人表示,很多企业的数据量达到几百TB的规模时,数据库的并发处理能力和处理延时等技术指标就会下降得很厉害,inData数据库一体机能帮助用户有效地解决这一问题。
横向扩展的数据系统
inData采用了配置KAS存储虚拟化模块的浪潮K-DB11g软件和优化的X86服务器、Flash存储以及InfiniBand等加速硬件,具备智能分布式存储、软硬件极致优化器、一体化资源管理等高级功能。
相比于共享统一存储的传统数据库,inData最大特点是采用了分布式架构,由纵向扩展转变为横向扩展,从而可以承载PB级数据量、处理海量并发访问。系统分为计算、存储和网络三个软硬件紧耦合的资源池,多个数据库计算节点构成RAC集群,配置I/O加速系统的服务器在KAS统一管理下构成存储池,所有的计算、存储设备通过2台或以上的InfiniBand交换机连接。
存储虚拟化KAS 读写百万IOPS
KAS采用了多副本、分布式的数据存储管理技术,数据会有2-3重副本,数据及副本被同时写入多组磁盘,系统I/O性能会随着磁盘数量的增加线性增长,解决了长期以来的数据库磁盘性能瓶颈,而且,多副本技术还隔离磁盘故障对于系统的影响,磁盘发生故障后,系统会继续从其他节点读取数据。
另外,inData会自动统计数据的访问频次,将经常被访问的“热点数据”存储在热点盘——PCIe SSD闪存卡中,不经常访问的数据则会存储在大容量机械磁盘中,兼顾了成本与性能。
性能优化,每分钟数百万事务处理
inData系统能轻松实现百万级IOPS、海量吞吐与微妙延迟,而且浪潮对于系统进行细致的整体优化,这些优化技术很好地降低了磁盘I/O频次,减少了数据热区,并且让系统负载更合理地分配,让系统的在线事务处理能力达到了每分钟数百万次。
例如独特的智能过滤技术。inData在处理需要Full Scan全表扫描的复杂请求时,计算节点接收到的大SQL语句会拆分为多个小SQL语句,随后卸载到各存储节点进行处理,存储节点处理完毕后将结果集返回计算节点进行整合,然后响应给用户,这样可以更为有效地利用存储节点的计算资源,提高系统性能
大会上,浪潮介绍了inData在政府行业的应用案例,该用户的数据来源复杂,包括人物关联表、区域监控录像、交易记录、语音、征信等十几种,数据量也十分惊人,浪潮为用户开发定制版的inData系统,将原来的OLTP、OLAP整合为统一的HTAP系统,用户的项目开发周期缩短了2个月,并减少了50%的数据实例节点。目前,该系统数据量为180TB,每天加载数据1TB,数据生命周期为180天,数据量将逐步达到峰值400TB。
下一代,融合HTAP与Big Data
伴随着企业数字化转型的深入,越来越多的企业开始用HTAP来替代原有的OLAP和OLTP系统。inData为一站交付式设计,可以开箱即用,并且界面化操作,简洁易用。浪潮还提供原厂的全程技术服务和技术培训,可以让用户更快地跨过应用门槛。而且,inData兼容目前各个数据库行业通行的标准,很好地融入了当前的数据生态,降低了后续维护的技术复杂度和成本支出。