随着云计算、大数据、区块链、人工智能等现阶段科技领域的主流和热点技术应用,一个智能时代似乎已经呼之欲出。然而,人工智能的发展依然面临许多挑战:如何解决智能时代的隐私保护问题?人工智能产业化的下一个驱动力何在?
6月17日-18日,由谷歌主办的“联邦学习研讨会(Workshop on Federated Learning and Analytics)”在西雅图举办,人工智能国际专家、微众银行首席人工智能官(CAIO)杨强与四十余位业界专家学者共同受邀出席,围绕联邦学习、分布式优化和分析、密码学、算法公平性以及差分隐私保护和政策等议题展开讨论,探索学术合作。
谷歌联邦学习研讨会
会上,杨强教授发表了特邀报告——《安全的联邦迁移学习:在保护隐私的前提下共享知识》(Secure Federated Transfer Learning:Knowledge Sharing without Compromising Privacy)。他在报告中指出,联邦学习技术将成为破解智能时代数据保护和用户隐私保护难题的利器,成为推动人工智能产业化成功的重要驱动力。
杨强教授特邀报告
联邦学习将引领下一波机器学习技术商业化浪潮
人工智能不断进化的背后,也是机器学习的不断进化。那么,机器学习正在朝哪个方向发展?这种趋势又将如何影响整个人工智能产业?
人工智能落地面临的主要困境是数据问题,“小数据”和“数据孤岛”一定程度上阻碍了人工智能的商业化进程。针对小数据难题,杨强教授和团队提出了“迁移学习”的理论体系,并将其应用于推荐系统等实际应用中,让机器具备了知识迁移、“举一反三”的学习能力,在第30届神经信息处理系统大会(NIPS 2016)上,著名人工智能专家吴恩达总结机器学习发展趋势时曾表示:“在监督学习之后,迁移学习将引领下一波机器学习技术商业化浪潮。”
随着数据隐私保护和数据安全形势日益严峻,GDPR等一系列严格的数据隐私保护法律法规出台,出于政策法规、商业竞争等因素,机构间数据很难互通, “数据孤岛”成为人工智能落地的更大阻碍之一,迁移学习或许能解决小数据问题,但如何实现行业内甚至跨行业的更大范围合作,对人工智能商业化来说更为重要。这不仅仅是技术问题,更成为一个复杂的社会问题。
联邦学习作为分布式的机器学习范式,可以有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,能从技术上打破数据孤岛,实现AI协作。谷歌在2016年提出了针对手机终端的联邦学习,微众银行AI团队则从金融行业实践出发,关注跨机构跨组织的大数据合作场景,首次提出“联邦迁移学习”的解决方案,将迁移学习和联邦学习结合起来。据杨强教授在“联邦学习研讨会”上介绍,联邦迁移学习让联邦学习更加通用化,可以在不同数据结构、不同机构间发挥作用,没有领域和算法限制,同时具有模型质量无损、保护隐私、确保数据安全的优势。
开源框架推动联邦学习落地应用
近年来对联邦学习的研究不断涌现,谷歌TensorFlow Federated(TFF)开源框架和微众银行Federated AI Technology Enabler(FATE)开源框架的推出更是加速了联邦学习从概念走向行业落地应用。
2019年3月,谷歌开源了TFF,可用于去中心化数据的机器学习及运算实验,为开发者提供分布式机器学习,以便在没有数据离开设备的情况下,便可在多种设备上训练共享的机器学习模型。
而FATE是2019年2月微众银行AI团队对外发布的自主研发开源项目,也是全球首个联邦学习开源框架,为联邦AI生态提供了工业级别的联邦学习框架。提供了基于数据隐私保护的分布式安全计算框架,为机器学习、深度学习、迁移学习算法提供高性能的安全计算支持,安全计算包括同态加密、秘密共享、哈希散列等多种多方安全计算协议。同时,FATE提供了一套友好的跨域交互信息管理方案,解决了联邦学习信息安全审计难的问题。简单易用的开源工具平台能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的前提下,进行多方数据使用和联合建模。目前FATE已经在信贷风控,客户权益定价,监管科技等领域推动应用落地。
走向未来的联邦学习技术
未来,联邦学习将走向何方?谷歌研讨会上总结了未来联邦学习的主要研究方向:让联邦学习更加高效和有效;拓展联邦学习边界,解决更多问题;探索联邦学习新的应用场景;增强联邦学习的健壮性和抵御攻击的能力;突破准确性和实用性目标,更加关注隐私、安全和公平。
谷歌联邦学习研讨会闭幕总结
6月17日,国家新一代人工智能治理专业委员会发布《新一代人工智能治理原则——发展负责任的人工智能》,提出了人工智能治理的框架和行动指南。新发布的《治理原则》,强调了和谐友好、公平公正、包容共享、尊重隐私、安全可控、共担责任、开放协作、敏捷治理等八条原则。这些原则也正与联邦学习的发展方向相一致,而相关政策对于隐私保护和开放协作的要求也为联邦学习的进一步发展提供了政策驱动力。
无论是从技术发展路径,还是政策法规大环境来看,可以预见的是,联邦学习将成为下一个推动机器学习取得商业化成绩的主要驱动技术,对于联邦学习的研究和落地探索不会停止。在科技之外,联邦学习涉及经济学、法律等多领域,在公平有效的激励机制下,多方共同参与,建立公平健康可持续的合作生态,才能真正实现“君子和而不同”的“联邦”初衷,让科技向善,普惠大众。