明略科技携隐私计算赛题亮相CCF大数据与计算智能大赛

近日,2020年第八届CCF大数据与计算智能大赛决赛暨中国大数据技术大会在长沙举行。本届大赛共设置4大赛道,共计20道赛题,吸引了来自全球25个国家、1247所高校、1873家企业的43795人,37994支队伍参赛,提交作品83361次。其中,算法赛道的《非结构化商业文本信息中隐私信息识别》赛题出自企业级数据分析和组织智能服务平台商明略科技。

随着社交网络、移动通讯等技术的迅速发展,网络中存在大量包含隐私数据的文本信息。如何在非结构化的本文信息中,精准识别隐私数据,并对其进行保护,是亟需解决的隐私保护领域的问题。

在商业领域中,在保证双方隐私信息(公司及其客户的技术数据等)不被非相关人员或企业泄漏的情况下,收集客户需求并进行挖掘通常需要对本文中的隐私数据提取后,做进一步匿名化等隐私保护操作。而现有的隐私保护方法,如K-匿名、差分隐私等技术较为成熟,但缺少对隐私信息识别的关键技术。

明略科技作为出题单位,将此次赛题的关注点集中在隐私属性的识别问题,针对非结构化的本文信息进行分析,精准提取所涉及的隐私信息,为后续隐私保护操作提供支撑。

目前,明略科技面向隐私数据的全生命周期均有相应的安全技术支撑,在整个过程中,除常规隐私信息外,还考虑到准标志符对于隐私泄漏的影响。在数据存储阶段,采用密码学(MD5、SHA256、AES、DES)、访问控制(RBAC)等手段保障数据安全性;在数据传输过程中,采用多源数据融合的差分隐私、加密(DH、RSA、Paillier)、数字水印等手段保障数据的安全性和完整性;在安全计算阶段,采用多方安全计算(SS、OT、GC、PIR、PPDM)、联邦学习(HFL、VFL、FTL)等手段保障隐私数据的安全性。

据悉,CCF大数据与计算智能大赛,由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用、系统、创业大型挑战赛事,目前已成为中国大数据与人工智能领域最具影响力的活动之一,是大数据综合赛事第一品牌。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养大量高质量数据人才。