人工智能大规模应用催生了对AI安全更迫切的要求。9月1日下午,在上海“2022 世界人工智能大会-可信AI论坛”现场,中国信通院、清华大学、蚂蚁集团联合发布AI安全检测平台“蚁鉴”,面向AI模型开发者提供从模型对抗测试到防御加固的一站式测评解决方案,帮助开发者一键识别和挖掘模型漏洞,打造更安全可靠的AI。
据了解,这也是行业首个面向工业场景全数据类型的AI安全检测产品。该平台基于蚂蚁多年的风险对抗实践,集1000多件可信AI专利于一身,融合了自研的智能博弈对抗技术,可以实现文本、图像、表格、序列等不同数据类型的自动化测试、量化评分和安全性增强。
蚂蚁集团大安全技术部总裁李俊奎介绍,该平台内嵌了自研的AI安全计算引擎,计算性能提升了数十倍;内置了40余种国内外主流及自研的攻击算法模型,通过模拟黑产及自动进化攻击手段,对AI模型“检测—防御—升级”,可有效发现AI模型漏洞,减少系统性风险;此外,该平台覆盖了对模型未知情况下的“随机噪声”、“迁移攻击”等攻击样本,更符合工业界应用的攻击评测基准。
李俊奎说,该平台支持零编码测评,用户上传待测模型,选择攻击算法后,平台可自动化评估AI安全风险,全面加固模型算法。该平台现已开放AI模型鲁棒性测评,未来持续增加模型可解释性、算法公平性、隐私保护等特性的检测服务。
据介绍,“蚁鉴”AI安全检测平台搭载的技术能力,已在蚂蚁的交易安全、核身安全、内容安全等多个场景有效应用实践。例如,在垃圾账号治理场景上,通过平台基于深度神经网络的博弈攻防模型,模拟黑产攻击手段提前防御,风险账号漏过减少2成多;在内容安全文本场景,基于文本对抗训练的模型,降低风险漏过38%;在凭证认证场景,基于平台提前发现的模型问题和对抗训练增强方案,消除23%的潜在黑产攻击威胁项。
中国信通院云计算与大数据研究所内容科技部副主任石霖表示,人工智能技术与制造、医疗、能源、交通、城市建设等领域深度融合,AI算法问题也在不断出现。算法黑箱、算法设计缺陷、数据依赖、对抗样本攻击等问题对智能技术的产业化应用带来较大安全隐患。AI面向工业场景大规模应用,要实现全链路安全可信,持续加强模型鲁棒性。
清华大学副教授李琦表示,人工智能算法的通用自动化检测是研究和解决人工智能安全问题的核心。此次推出的AI安全检测平台,首次全面解决了不同场景下AI算法的系统化和自动化评测,并提供了AI工业级应用的安全量化评价指标,有助于为人工智能算法在工业界的大规模应用提供安全保障。
公开资料显示,今年8月份,这项AI安全检测平台获评信通院“2022年可信人工智能实践案例”标杆案例。蚂蚁集团自2015年起投入可信AI技术研究,拥有全球范围内数量最多的“AI安全可信关键技术”专利,已在反欺诈、反洗钱、反盗用、企业联合风控、数据隐私保护等场景落地。