这一周,国内最吸引眼球的两个展会,无疑是贵阳数博会和北京软博会,而他们共同的关键词之一,毫无疑问是大数据。
5月26日,中间件知名厂商金蝶天燕在软博会上正式推出大数据相关的产品,这就是自主研发的大数据平台ADP(Apusic Data Platform)及政府数据共享交换解决方案,在因为两个展会而新闻频出的背景下,金蝶天燕的这条消息显得不那么突出。
然而,从中国大数据产业链的角度来看,金蝶天燕ADP及政府数据共享解决方案的价值其实不容忽视。原因如下:
1.在国内大数据生态链中,不同层面云集了数百家中外厂商,但是,国内提供大数据服务的厂商主要集中在生态链底层的数据源层面以及应用层,在基础架构层与数据分析、处理层面,国内厂商从数量到解决方案还显得比较薄弱。金蝶天燕推出大数据平台ADP(Apusic Data Platform)及政府数据共享交换解决方案,是这个层面的一个积极的补充;
2.政府数据开放共享,是目前大数据产业呼声比较一致的一个命题,但是这一领域的开放共享,涉及到很多壁垒尤其是部门或系统利益的博弈,以及数据治理背后的技术、平台、标准等各种问题,金蝶天燕政府数据共享交换解决方案切中了这一痛点;
3.在国产中间件阵营中,金蝶天燕居于重要位置,推出大数据方面的产品与方案,完善了其自身产品完整性,有利于企业竞争力的打造。
数据处理是企业级计算的核心,金蝶天燕作为基础软件厂商,发力大数据实属顺理成章。下面具体看看金蝶天燕大数据平台及解决方案有哪些特点。
平台型产品:金蝶天燕ADP
金蝶天燕ADP通过对大数据存储、分布式计算、数据分析、数据访问及数据可视化的全方位支持,支撑政企的大数据架构及解决方案,帮助其构建大数据驱动业务体系。这是该平台的基本定位。
据介绍,金蝶天燕实际上于2014年2月就开始了ADP的预研,同年6月,形成了最初的产品规划,包括数据采集、交换共享、数据计算等功能;2015年1月,大数据科研项目正式立项,获得了深圳市经贸信委的科研基金支持。
2015年7月,金蝶天燕发布支持大数据采集交换的系列产品AETL、ADXP,12月,平台产品ADP内部发布,经过数次迭代,于2016年5月26日正式对外发布。据透露,目前金蝶天燕ADP已经在苏州工业园区、某烟草企业以及深圳市教师教育网得到应用。
从技术角度,金蝶天燕ADP有以下几个特点:
秒级实时数据分析处理能力:支持流处理、批处理、图计算等多种计算范式;实时流处理具有秒级响应能力;批处理响应速度可优化至分钟级。
丰富的数据分析、展现模型:提供聚类、回归、协同过滤、频繁模式发现等主流机器学习算法;支持面向数据分布、预测、统计等场景的可视化。
极速的数据计算节点伸缩:支持容器化的快速部署;支持自动化的运行维护;兼容多种主流的云计算基础设施。
PB级多源数据存储管理:提供多源异构数据的统一存储管理;支持结构化、半结构化、非结构化数据接入;可管理数据存储容量可达PB级。
值得一提的是,在技术选型方面,ADP采用了SPARK技术框架,这符合政府企业计算和存储分离的需求,能够支持政府企业现有的存储资源与大数据平台的融合。此外,SPARK使用内存计算方式,业界一般认为其性能比HADOOP要快10到100倍,能够支撑政府企业对大数据实时处理分析的场景。
在此基础上,ADP对SPARK SQL引擎进行了增强和优化,以适用于企业计算。针对政府企业的现有存储系统,ADP还创新性开发了能够对接各种集中式存储的文件接入层以适应SPARK运行,同时ADP开发了自己的作业调度和多租户云隔离机制,从而增强了应用的灵活性。
金蝶天燕ADP技术负责人表示,开源产品是ADP的基础代码库与思想源泉,金蝶天燕将在此基础上加入自己的创新,增强功能,改进问题,同时也会开发开源产品不会涉足的工具。
实际上,应用端对大数据的需求主要体现在大量数据的查询与处理,数据分析、挖掘,以及机器学习的需求也正在不断增加。金蝶天燕定位在为大数据处理提供通用的计算分析平台,目标是让客户快速部署大数据系统,能够方便的使大数据应用融入到云环境中。
下一步,金蝶天燕将进一步完善平台,帮助客户快速、方便部署大数据处理能力,提供方便的工具,排除开源产品的缺陷。未来,将进一步完善产品的分析能力,能够给客户提供成熟的一键机器学习、深度挖掘的强大数据分析能力。
政府数据共享交换解决方案切中痛点
大数据是当前热点,政府数据共享交换是不是过时了?
面对这个问题,金蝶天燕专家表示,政府数据共享交换的确是个老话题,可以追溯到2004年《关于加强信息资源开发利用工作的若干意见》。进入大数据时代,政府数据共享交换作为棘手问题,依然亟待解决。
首先,一般而言的大数据,是指分析型应用。政府数据共享交换是为大数据应用进行数据准备,从本质上讲是政府大数据应用的必要前提。
其次,政府数据的最大身份是社会公共数据资产。这决定了分析型应用不是主流,公用数据集才是主流,重点还是政府数据共享交换。
最后,数据共享交换是落实大数据发展行动纲要的瓶颈。只有偿还这个历史欠账,才能更好地推进大数据应用。
金蝶天燕专家认为,政府数据共享交换问题的本质,是信息的高度分散性和无序性与利用信息的高度集中性和选择性形成的矛盾。解决政府数据共享交换问题的基本思路,是通过具有示范效应的公用数据集建设和数据应用服务开发,拉动统一的、公用的数据共享交换基础设施建设,以及数据管理机构和政策法规配套。
政府数据共享交换需要解决三个问题:
一是数据整合问题。从多个信源单位向统一数据中心进行数据采集、转化和加载,建立各种主题的公用数据库;
二是数据服务问题。向各类服务对象(包括最终用户和应用系统)提供数据服务,建立统一的服务入口、服务目录和接口实现;
三是数据治理问题。将数据管理体制和机制固化到数据平台中,实现全生命周期的数据管理。
政府数据共享交换格局正在发生变化。部门之间信息资源的供需匹配,让位于综合性的公用数据集建设,比如当前正在推进的社会信用体系建设。不难看出,政府数据共享交换的应用趋势是资源化、服务化,技术趋势是中心化、平台化。
因此,金蝶天燕发布政府数据共享交换整体解决方案,概括为“一个门户、两个体系、三个平台、四个库和多项应用服务”:
一个门户是指数据服务门户;两个体系是指数据管理机构和制度体系;三个平台是指资源目录平台、数据交换平台和服务整合平台;四个库是指信源单位数据库、元数据库、基础与扩展数据库、主题与专题数据库;多项应用服务是指基于数据服务门户,提供可扩展、可定制的数据应用服务。
对于政府数据共享交换解决方案,金蝶天燕有数据资源化、数据服务化、数据服务门户三个产品线,年内还将发布数据治理平台。
数据资源化产品线有三个产品:AETL数据集成中间件、ADXP数据交换平台和ARC资源目录平台;
数据服务化产品线有两个产品:AESB服务总线和ASG服务治理平台;
数据服务门户提供四类服务:数据目录及内容服务,数据应用服务,SOA服务目录及 接口,集成上述产品提供运行监控服务。
金蝶天燕专家表示,政府数据共享交换解决方案的核心价值在于:
一是构建大数据时代的政府数据基础架构。从政务信息资源目录体系和交换体系到政府大数据,政府数据基础架构面临升级换代。除了数据整合和数据服务能力,还要加强数据治理能力。
二是运用大数据支撑政府治理和公共服务创新。构建以社会信用为核心的新型市场监管体系,推行“互联网+政务服务”等信息惠民服务,需要建立各种管理和服务主题的公用数据集,这些都离不开跨部门、跨地域的大范围、大规模的数据整合,需要数据平台的有力支撑。
三是探索政府大数据管理的成功范式。政府数据管理正在成为一项专业职能,重点是元数据管理、数据质量、数据安全等,这是新一代数据平台的发展定位。
数据共享交换与大数据应用应该互为支撑,协同发展。从2008年以来,金蝶天燕大量承建从部委到地方的数据相关平台、资源和应用项目,积累了丰富经验。为了适应信息化发展从IT到DT的转型,数据平台产品不断升级换代。金蝶天燕将紧跟政府大数据发展潮流,在政府和公共事业领域率先探索,让政府数据发挥最大价值。
另据透露,在国务院《促进大数据发展行动纲要》的框架之下,关于政府数据开放共享的相关细则即将发布,这将是一个非常重大的落地准则。让我们拭目以待。