奥卡姆AutoML平台助力平安科技智能防疫论文入选国际语音会议

近日,平安科技联邦学习技术团队的论文《A Real-time Robot-based Auxiliary System for Risk Evaluation of COVID-19 Infection(基于机器人新冠肺炎风险评估辅助系统)》被国际语音领域A级INTERSPEECH 2020接收。

一年一度的全球顶级语音大会INTERSPEECH是语音科学和技术领域国际学术会议。会议期间,来自全球学术界和产业界的研究人员共聚一堂,讨论语音领域的新技术,涵盖语音合成、语音识别、语音增强、语音新应用等众多细分领域,在会议上展示的研究成果将代表着语音相关领域的最新研究水平和未来发展趋势。

这篇论文是业界一次创新的探索,成功通过检测咳嗽声音来判断COVID-19感染状况,这是继加入健康养老国家项目后,平安科技将先进技术用于社会健康服务的研究成果,再一次得到了全球专家的认可和肯定。

1、Occam-COVID-19检测系统:更快,更稳,更强,

平安科技联邦学习团队开创性的提出利用咳嗽检测COVID-19的智能系统。该系统采用前沿的Few-shot Learning方法作为检测核心,用以解决COVID-19患者数据较少的问题。同时,论文创新性的提出高阶注意力相似度方法,通过将不定长的语音转换为相同的序列进行注意力相似度比较,从而获得更精准的模型来诊断疾病。

得益于应用平安科技自主研发的至强引擎——奥卡姆Occam AutoML一站式AI开发平台,COVID-19检测系统从收集数据、设计算法、验证算法,再到算法落地,整个过程仅仅花费27天10个小时,真正践行了与生命赛跑的真谛。COVID-19智能检测系统作为平安自主研发的智能防疫系统,目前已被成功应用于国家健康养老项目,为我国智慧医疗建设提供了强有力的技术支持。

图 1 COVID-19新冠肺炎智能检测系统

2、Occam平台助力智能防疫

AI模型的开发需要多次的数据收集与模型训练,这会耗费大量的时间与人力,并且模型在实际落地过程中需要经历复杂的部署流程。然而疫情爆发之时,每分每秒都在与死神抢夺生命。Occam平台实现全流程的极简与自动化,定义全新的AI开发模式,帮助COVID-19智能检测系统在最短的时间内完成了从算法开发,模型训练到系统落地的全部流程,并且取得了极高的模型准确率。

下面就一起来看看Occam平台是如何助力高效完成智能防疫系统开发的:

1.“处理这些数据,最起码要一周多。”只需不到一天

在COVID-19智能检测系统开发的初期,多种音频文件格式以及不同深度学习平台的交叉使用一度成为限制算法开发速度的瓶颈。经过团队不懈努力,Occam平台成功将处理时间从一周压缩到一天以内,实现了倍数级飞跃。 Occam平台秉承简约高效的原则,为用户提供了从数据处理、算法开发、模型训练、模型优化再到模型推理的全周期AI工作流,提供包含数据标注、数据增强、多元模型自动搜索、超参优化、模型自动压缩等多种特色服务,支持图像分类、图像检测、语音识别、文本分类等丰富的AI应用场景。

与此同时,Occam平台从环境镜像、预训练模型、GPU算力等多个角度提供了全面的资源支持,让使用者体验飞一般的感觉。在本次科研中,Occam平台结合Tensorflow,Pytorch,Sklearn等深度学习框架,并与sox,ffmpeg等多媒体处理工具相结合,在极短的时间内处理了wav,MP3,flac,ape等多种格式的音频文件,并从中提取到更合理的特征信息。Occam平台提供多个任务的公开数据集以及对应的先进SOTA标准,使用者可以快速与SOTA标准对比,从而更快地改进网络结构,在已有任务基础上进行向上更新的方向探索。例如,在本次科研中,利用咳嗽声检测COVID-19是一个全新的任务,我们从已有的知识出发,利用多个已知任务(情感识别、语音事件分类等)的SOTA模型进行验证,并从中发现诸如数据量较少的问题所在,接着使用Few-shot Learning的模型用来验证猜想。这其中展现了以微服务架构为基础的Occam平台的智慧结晶。训练过程中,平台拥有的上百个节点的GPU服务器集群为模型训练提供强大的算力支持,大幅度减少了算法开发时间。

图 2 Occam平台端到端一站式AI开发流程

2.“训练开始了吗?”已经出结果了。

训练速度慢,多机多卡无法线性加速始终是限制算法开发速度的重要因素,也是本次科研项目进展过程中的另一大阻力。为了提升研发人员的工作效率,Occam平台专注创新,突破性的开发出多项核心自研技术,例如Occam平台自主研发的AutoDL分布式深度学习框架,通过分级分布式并行体系架构,大大提升了模型训练速度。在本次科研工作中,COVID-19智能检测模型借助Occam平台的分级分布式并行体系架构,在4机16卡的训练中实现了超越一般分布式训练框架的线性加速,模型训练时间大幅缩短了87%。同时,Occam平台涵盖了各种先进的神经架构搜索算法,使用者可以根据自身需要在自定义的搜索空间中,利用强化学习,贝叶斯等方法在最快的时间内获得最优参数。此外,实际的平台应用中,Occam团队针对算法落地时产生的问题,进行了大量的优化工作,包括容器化、并行运算、分布式存储等,例如根据数据访问热度和数据流特点设计了数据均衡算法,有效地将压力分配给多个备用服务器。

3、浪潮之巅:Occam平台获得多项世界第一

在过去的一年里,Occam平台荣誉满满。从PASCAL VOC目标检测冠军到斯坦福DAWNBench推理竞赛冠军,从WMT2019国际翻译大赛冠军到COCO-Text比赛冠军,凭借过硬的技术实力,Occam平台已经斩获7个国际竞赛总冠军,24篇国际学术会议论文,446项专利,并且荣膺8项金融科技奖项,犹如一颗深水炸弹引爆人工智能领域,全面助力产业发展。

平安科技联邦学习团队与Occam平台一直致力于降低AI开发的准入门槛,拥抱人工智能大潮,推动各行各业与人工智能的结合,通过为不同层级、不同需求的用户提供个性化的定制服务,实现真正的AI价值。例如在本次疫情中,合理使用AI技术,防控疫情,尽快让各行各业在有效防控下复工复产,这才是AI技术真正地价值体现和根本目的。

领先团队锤炼打造,Occam平台剑指AI领域新突破

平安科技联邦学习技术部AutoML项目组,由平安集团首席科学家肖京博士指导,平安科技副总工程师王健宗博士带领,汇集了来自国内外高等院校毕业的硕博人才,致力于推动自动化机器学习领域的生态发展。团队将行业应用与前沿AI技术进行深度、自动化融合,打破传统AI训练存在的“模型差”、“调参难”、“训练慢”等技术难点,一键开启人工智能训练便捷新时代。作为人工智能领域的前沿探索者,AutoML团队在构建专业AI新未来的目标指导下深耕自动化机器学习领域多年,不断挖掘人工智能高效自主赋能金融科技等领域的全流程解决方案,突破人工智能边界,用更先进、更科学的技术助力实业发展,为各领域的发展创造更大的价值。