“互联网+政务”时代,政府大数据安全如履薄冰

2018年4月初发生的Facebook泄密事件仍然在全球范围内不断发酵,其核心原因正是数据安全已经超出互联网企业与个人隐私间的恩怨,上升到与国家命运息息相关的高度。而在中国,随着“互联网+政务”工作的不断推进,政府相关机构也已经成为爬虫、拖库、网站克隆等攻击的重点目标。这不禁让人发问,掌握着大量国家政务服务和数据的政府大数据,还安全吗?

防不胜防,爬虫攻击后果不堪设想

政务服务广泛分布在交通、社保、民政、旅游、公共安全等多个领域,数据数量大、机密性强、附加价值高,且大多和国计民生紧密关联,一旦遭到攻击,后果不堪设想。然而据统计,目前国内政府网站40%—60%的网络流量均来自爬虫,在提供公众查询的服务性网站业务中,这一比例甚至更高。

爬虫爬得不亦乐乎,但数据泄漏带来的负面影响却无法言尽——

数据非法利用,政务网站风险加剧

数据被爬取后所引发的安全风险正愈演愈烈。人资社保、工商税务、专利信息查询等政府网站都在为公众提供正规的线上数据服务,但是互联网上却同时泛滥着大量的非正常数据应用服务,以及线下的非法数据售卖。这不仅会增加企业及公民信息外泄和被利用、被伪造的风险,也使得互联网商业竞争环境更加混乱,难以控制。

网站被克隆,政府公信力丧失

除了利用爬取数据进行牟利,更有甚者,直接挪用政府公众服务类网站所有网页及信息,进行网站克隆。克隆网站通常拥有与真实网站高度相似的域名和首页,用户一般难以辨认。然而当民众打开一个明为提供国计民生服务、实为不法平台的克隆网站,不仅会看到许多不堪入目的广告,甚至会在不知不觉中被引诱点击诈骗链接。那么,作为受害者的政府网站,又该如何维护公信力呢?

公民隐私权被侵犯,政府权威受挑战

《网络安全法》明确了个人信息安全的突出地位,政府有责任保护公民的信息安全。作为提供民生服务的政务网站,包含着海量集中的、与公民及企业相关的真实数据,如果被不法分子盗取并利用,不仅会直接损害当事人隐私权等民事权益,而且会影响公众今后向政府提供数据的态度,使得公众对政府后续提供的数据的完整性、准确性和权威性产生怀疑。

运维困难、投诉不断,陷入恶性循环

政府网站被大规模攻击后,网页打开缓慢、无法正常处理业务等问题会严重影响用户的使用。为此许多政府网站已经投入大量人力和资金,但在不断更新迭代的自动化攻击面前,改善并不明显。“爬虫攻击网站——系统宕机——用户投诉——耗资维护”这一过程似乎已经成为一种恶性循环。

保障业务安全,为传统安全机制所不能

需要再次强调的是,自动化工具攻击并不是一成不变的,爬虫等技术也在不断发展,手段越来越“高明”。它们不再是简单的脚本或程序,而是在一定程度上能模拟人的行为或浏览器行为。因此依赖签名与规则等的传统安全防御技术,已经无法抵御新兴的安全威胁。

那么,面对层出不穷的自动化工具攻击,政府网站就真的束手无策了吗?并非如此。瑞数信息的“动态安全”技术就可以做到传统安全防御所不能,并围绕客户业务量体裁衣,在以下数据安全应用场景中,为政务网站提供高效的安全保障:

  • 防爬虫 防治爬虫爬取网站上的数据,保护大数据安全,释放系统资源。
  • 防“内鬼” 防止利用合法身份,通过工具批量窃取内部数据。
  • 防数据遍历 防止利用逻辑漏洞,通过工具批量导出用户资料。
  • 防越权 防止利用权限漏洞,以低权限身份执行高权限操作。
  • 防拖库 防止通过业务逻辑,利用工具批量导出数据库信息。

以某政务服务网站的实际情况为例:虽然已经部署了传统安全防御产品,但是系统仍然经常被攻击,网页无法打开,持续增加的投诉量令网站管理者苦不堪言。紧急上线瑞数动态安全产品后,60小时内,即识别并拦截了近4500万次异常访问请求,异常请求占到向该网站发起的总请求数的78%。深入分析所得安全威胁数据后,技术人员发现,使用Phantomjs、web_driver等常见的爬虫攻击工具进行非正常访问的情况最为普遍;而大部分爬虫都采用多源低频的方式,通过更换大量IP来规避安全检测机制,使得溯源难度加大。因此,瑞数在防批量爬虫时,核心方式就是运用“动态安全”技术进行人机识别,在所有请求中判断出哪些是真人访问,哪些是自动化工具在模拟人类获取数据。

动态安全技术,更主动、更轻量、更高效

那瑞数动态安全技术是如何进行人机识别、做到传统安全所不能的呢?“随变而变”、动态地进行安全防御就是瑞数给出的答案。

瑞数动态安全以创新的“动态安全”技术为核心,彻底转变了传统的安全防护思路,不再依靠任何特征或规则,而是通过动态变幻,增加服务器行为的不可预测性,大幅提高攻击难度;又通过严密检查运行环境、浏览器指纹、疑似攻击行为等因素,在正常流量中高效甄别并阻拦由自动化爬虫工具发起的访问需求,保护政府大数据安全。

从部署架构而言,瑞数动态安全采用反向代理模式部署于受保护的网站之前,可以通过负载均衡设备监控系统状态,保障应用的高可用性;也可以进行横向扩容,不会形成网络性能瓶颈。

从防护层面而言,瑞数动态安全技术贴近业务,解决的都是实际的业务安全问题,与传统安全防护相比,瑞数能够很快让用户感受到安全技术带来的价值。

概括地说,瑞数动态技术安全防护具有以下优点:

  • 主动防御 克服传统技术天然缺陷,不依赖传统特征码、阀值、打补丁和策略规则,通过四大动态技术使得自动化攻击工具失效;
  • 轻量管理 无需修改应用服务器代码,无需配置任何规则,也无需更新规则和特征库;
  • 高效回报 不影响服务器的正常运作,释放系统资源,降低运维成本,投资成本得以具象体现。

主动防御技术正在成为政府和企业安全防御的新趋势。2017的IDC报告明确提出,移动目标的动态防御技术已经成为与机器学习、行为分析、威胁情报技术一样在主动防御领域的重要技术。只有以动态安全技术进行主动防御,才能掌握先机,在自动化攻击面前持续为政府数据安全保驾护航。