6月22日,在英特尔生命科学信息技术论坛上,英特尔、浪潮、华大基因、阿里云联合宣布启动精准医疗GATK中国社区,并成为该社区的首批成员。浪潮人工智能与高性能计算总经理刘军在大会做主题报告《AI+HPC加速生命医学应用》,同时,英特尔还为浪潮基因一体机颁发了“最佳实践奖”,表彰其在精准医疗方面做出的贡献。英特尔公司副总裁兼中国区总裁杨旭、国家科技部重大科学计划转录组研究首席科学家于军教授、美国BROAD研究所GATK团队代表Kate Voss等业内专家出席了该会议。
GATK(The Genome Analysis Toolkit,基因组分析工具包)是目前使用最广泛的二代重测序数据分析软件,由美国BROAD研究所开发,主要注重于变异的查找、基因分型且高度重视数据质量。此次GATK中国社区的启动,不仅将极大促进中国精准医疗用户更快更好应用GATK,同时也将成为英特尔“精准医疗合作伙伴计划”的重要组成部分。目前,英特尔正全力推动这一计划的开展,以期在2020年实现24小时内快速完成精准医疗,涵盖从基因测序到医学分析最终到制定医疗方案等全过程。
精准医疗依赖HPC技术发展
无论是治疗的有效性,还是减少医疗资源浪费,乃至更全面的健康管理,基于基因测序和大数据基础之上的精准医疗,都将是人类未来医疗发展的必然趋势,这也是政府间与医学界的共识。
即便未来发展潜力巨大,但目前精准医疗的普及发展并非一帆风顺,还存在诸多痛点。除了因涉及隐私而难以开展的健康数据收集问题外,成本、医生素质、靶向药物开发以及技术等问题也制约着精准医疗的发展。其中,技术本身是精准医疗所面临的最核心最根本的难题,比如在基因检测运用最为成熟的NIPT领域,就面临着精准度、检测周期、假阴、假阳现象等诸多难题,这也是目前全球各国精准医疗所面临的一个共同难题。
在精准医疗面临的众多技术问题中,HPC技术是一项非常关键性的技术。要知道,基因测序是精准医疗的前置技术,而目前基因组测序极度依赖HPC,它直接关乎基因数据的测序精度和测序效率。比如一个人的完整基因序列需要由数十万的基因片段拼接而成,只能借助HPC来完成,拼接结果的准确程度、拼接的速度都与HPC息息相关。此外,对基因数据的比对、分析从而确诊以及新药研发等等,都离不开HPC技术的支撑。
浪潮基因计算一体机加速精准医疗发展
从某种程度而言,HPC技术决定了精准医疗的质量与发展。而以HPC为基础的浪潮基因计算一体机的推出,从解决当前基因测序的效率问题入手,加速了精准医疗的发展。
基因计算一体机是浪潮自行开发的生物信息平台,它集成了基本的生物信息学工具,如Bowtie、Bwa等二代测序的比对工具和Fastqc等数据预处理工具,能够进行全基因组重测序等二代测序的数据分析,在大幅降低部署、优化时间的同时也通过“傻瓜式”操作降低了使用门槛。
目前,浪潮基因计算一体机已经多个基因研究机构、高校和医学机构得到应用,其中上海儿童医院开展的多项儿童罕见病研究就使用了这一创新的平台型装备。借助浪潮基因一体机预置的外显子组重测序和全基因组重测序流程,配合高通量测序仪测序和英特尔基因组数据库,上海儿童医院的医学专家们能够更好的完成对罕见病致病基因的还原与分析,并寻找潜在的治疗方案。这套系统现在可以在一天内完成多个Panel样本的基因测序以及检测流程,而未使用前完成同样工作量需要花费数天。
“AI+HPC”将对医学领域带来颠覆性改造
事实上,浪潮并未止步于以HPC推动医学进步。随着人工智能技术的发展,浪潮已经开始探索AI在医学上的应用。刘军认为,如果说HPC为医学带来了飞跃式发展,那么AI+HPC对医学领域的改造将是颠覆式的,将从生产力上对传统医疗行业带来改变。
人工智能在医学领域的应用有手术机器人、医学影像诊断到远程医疗等,主要用于医疗诊断、辅助治疗与健康管理、药物研发,其中医学影像是当前人工智能与医学结合度最好的领域之一。超过80%的医疗数据来自医学影像数据,而且非常重要的一点是这些数据的标准化程度非常高,便于机器阅读学习。医学影像智能分析是建立深度神经网络医学模型,然后把经过标注的数据对模型进行训练,出现误差后调整模型参数,再辅助以医学知识,通过大量的训练之后形成精准的医学辅助诊断模型,从而完成医学影像的判读,其识别准确率高,极大降低医学误诊率,并能大幅提高医疗效率。
目前,浪潮已从设计AI业务流程入手,帮助用户选择深度学习模型,测试验证识别精度。同时,经过优化的AI训练与推理性能,也能够解决数据处理和训练中的瓶颈。
毋庸置疑,将AI作为辅助诊断工具,将会大大提高诊断的效率和准确率,这将带来更广泛意义上的“精准医疗”。而浪潮作为中国人工智能计算力的领先者,在互联网行业已积累丰富的AI应用经验与基础,这会让其在医疗行业加速前行。目前,浪潮占据中国AI服务器市场60%以上份额,其中BAT的占有率达到80%,在科大讯飞、Face++等智能语音、智能图像领域也已实现广泛应用。