2017年4月13日,以“大探索、大发展、大融合”为主题的中国健康城市论坛暨健康医疗大数据峰会在北京正式召开。大会由国家卫生和计划生育委员会指导,中国医学科学院 北京协和医学院主办,中国医学科学院健康科普研究中心、中国医学科学院生物医学大数据中心承办,来自全国各地的500多名医疗相关人员出席了本次会议。
会上,中国医学科学院生物医学大数据中心主任蒋太交先生发表了名为《医疗大数据分析挖掘》的主题演讲。他从中国医学科学院生物医学大数据中心发展目标和定位,生物医学大数据分析挖掘和大数据医疗,团队针对公共卫生所获得的大数据挖掘成果三个方面进行了阐述,并断言,健康医疗大数据的发展将来肯定不仅仅是对公共卫生的管控会提出新技术新方法,也会对健康养生,未来的精准医学,个性化医疗提出新技术、新方法。
以下为蒋太交的演讲实录:
大家上午好,非常感谢大家来参加这次大会。今天上午我们邀请的嘉宾从基础医学、政策解读都给我们大数据做了很好的阐述,我的报告今天分为三个内容:首先给大家介绍一下中国医学科学院生物医学大数据中心发展目标和定位,然后介绍一下生物医学大数据分析挖掘和大数据医疗,三是我们团队工作进展汇报,就是大数据通过挖掘以后解决的公共卫生很重要的问题就是传染病的预测预警。
刚才周主任前面反复提到健康中国已经成为国家的战略,我们知道影响疾病健康是多因素的非常复杂,这就急需大数据的支持。我们中国医学科学院在这个行业里面非常具有优势,不仅在基础医学,而且在临床医学都是有非常丰富的资源,拥有6家附属医院、协和医院,肿瘤医院、整形医院、天津血液病和南京皮肤病医院,还有12个研究所。同时我们还具有全国的疑难重症指导中心。所以我们医科院长期以来不仅有丰富的资源也有大量的医疗大数据。
我们提到有国家的疑难重症诊治中心还有新农合也在我们医科院信息所,在这样一个其他下我们中国医学科学院是去年底通过成立了中国医学科学院大数据研究中心,我们这个研究中心将围绕临床医疗、卫生健康、基础医学大数据,把它统称为生物医学大数据,今天的概念比较多,有健康医疗大数据,也有医疗大数据,还有生物医学大数据,对我们来说这可能是差不多的,可能从不同的侧面对整个大数据的理解。我们主要是从事生物医学大数据关键的技术问题和重大的医学问题进行探索研究,着力打造生物医学大数据的技术支撑平台和转化应用平台,以提升我国在生物医学大数据的能力。
第一届学生委员会邀请刘德培院士和陈润生院士担任我们主席,邀请伯晓晨研究员、陈杰主任、陈翔主任、韩敬东教授、刘保延教授、尹岭教授还有我本人担任第一届学术委员会。
我们这个大数据中心它的建设目的,大数据的特点就是形成规范标准,互联互通,实现数据的互联互通和规范标准,打破信息屏障。第二发展人工智能和深度学习技术,从健康医疗大数据中发现新知识和新规律。建立系列医疗模型,推动基于大数据转化应用,促进“智慧医疗”和分级诊疗的实施。
所有我们这个大数据中心希望与国内外的同行合作,全面提升我国医疗大数据行业的特色创新能力,发展新技术、新应用和新业态。
第二个部分简单给大家介绍大数据的分析挖掘和大数据医疗。刚才大家都提到大数据的确是对于我们现在生活造成了深远的影响,比如说我们知道商品大数据已经改变了购物方式,交通大数据改变了人们的出行方式,通过滴滴打车平台改变了人们的出行方式。大家可以想象医疗大数据的发展对于未来的分级诊疗和落地也会改变人们的就医方式。
国家还有一个难题就是老百姓看病难看病贵的问题,从老百姓看病难看病贵的问题,从政策,从资源层面讲还有很多问题,从基层层面讲也有问题。我做了一个简单的总结,就是我们把现在的医疗理解为传统的医疗,它存在什么?医疗卫生资源稀缺,分布不均匀。同时因为医疗资源段,也浪费了,医疗效率比较低下。这一块可以讲通过大数据医疗,大数据与医疗融合的解决方案希望有提升,通过互联互通为医疗资源共享提供基础支撑,通过共享交换与业务协同达到提升医疗服务的质量和效率,通过移动互联和安全可靠,为远程医疗和分级诊疗提供保障,这就是未来大数据医疗产生的一些特点。
我们知道医院信息化的发展,特别是国家“十一五”、“十二五”以来,在医疗信息化已经积累了大量的数据,以电子病例为核心的临床信息系统里面,也蕴藏了跟疾病、诊疗相关的大数据。目前只是我们医院的临床数据再利用还是存在很大的困难。一方面我们知道医院里面业务系统比较多,但是形成信息孤岛。第二方面我们国家的规范化、标准化互通性程度低,三是信息需要二次加工,利用。所以它的未来肯定是要建立医院标准化的临床数据中心。
今天上午陈院士也提到了,基因组学的发展推动了精准医学的发展,在组学这块我们还产生了海量的数据,所以可以讲从未来一个人的角度来思考,我们人即是一个大数据,从健康临床数据,包括家族病史,体检数据、影像数据、诊疗数据、医疗预约号等等数据以外产生了组学数据,包括基因组学、转录组学等等,这些数据都是多维度的动态的数据。
一方面我们国家在医疗信息化方面取得了大量的很好的基础,包括临床医学的数据,基础医学的数据,人口健康的数据。但是另一方面国家没有很好的把这些数据发挥作用。简单来讲就是没有为临床的合作诊疗和医疗的监管和卫生经济的分析和公共卫生政策评价没有提供很好的支撑作用。究其原因是因为大数据层面还存在很多问题,这些问题只有通过把这些数据通过互联共享形成医疗大数据,在大数据进行深度分析挖掘才能够发挥它的价值。
医疗大数据应用需突破的核心问题,一个是在互联共享这一块,在规范采集与标准化,怎样进行医疗大数据的智能导航,怎样解决信息安全与隐私保护问题。在分析挖掘这块,怎么进行疾病早期诊断与预警,怎样辅助诊疗与智慧医疗的方案,怎样基于大数据进行精准医学与个性化治疗。
可以讲生物医学大数据还是一个沉睡的金矿,这个金矿需要大家一起来挖掘。我下面的内容由于时间的问题也是简单介绍一下我自己的团队在这方面的一些工作。
我这个实验室研究方向是生物信息学与医学信息需,我们主要开展大数据的异源和多维度信息关联与整合,我们一方面开展生物信息研究,包括基因核蛋白结构模拟,同时开展临床大数据,包括数据挖掘和机器学习,同时开展像传染病和慢病的流行病大数据的研究,所以今天介绍怎么从大数据的角度出发开展全病的新技术、新方法。
我们知道新发病和传染病在国际造成了很大的影响,我们实验室以流感作为实验对象,我们知道流感世纪性流感大流行会导致全球数百万甚至千万人死亡,季节性流感也会导致每年数十万人死亡,每年都会感染5%-15%的人口,所以流感的防控也是全球公共卫生一个重要的任务。我们知道大数据在公共卫生领域里面应用最成功的范例就是谷歌通过浏览器的搜索来预测流感的流行,我们知道当得病的时候,得流感的时候很多人都会在互联网上搜索跟流感相关的症状,跟流感的用药,谷歌就是根据人们搜索的行为,跟流感相关的行为预测流感的爆发。大家看,黑色的线是谷歌通过互联网大数据进行的流感的爆发情况与舆情。但是互联网数据是比监控的数据至少要早一个礼拜。
我们知道互联网数据还是存在很大缺点,不能确定是哪一种流感病毒在流行,也不能判断流感冰毒性的是否变异,因此它只能做预报,但是不能指导流感疫苗的使用也不能指导用药。后来我们实验室跟国家CTC合作,提出来一个新的方案,我们能不能整合互联网大数据和基因大数据进行流感防控,首先基于百度的流感搜索指数和吸纳的微博搜索指数,在全国监控流感爆发地点,一旦发现疫情的时候要获得病毒的样本病人的样本,两个样本进行分析流感的变异和爆发情况,我们采取了互联网大数据和基因大数据进行防控。这两个大数据的融合分析挖掘能够回答和传递一些重要问题,一个是新的传染病是怎么起源的,第二个是能否进行危害程度的早期预测预警。我们做了一系列的工作,包括发明了流感疫苗株推荐新方法。由于时间的问题我主要介绍这两个方面的结果。
我们知道接种疫苗是防控流感最有效的手段,为了有效提供疫苗,世界流行病组织有一个监控网络,虽然有这么大的监控网络,但是到目前为止世界卫生组织推荐疫苗是很低的,这条线是世界卫生组织推荐的疫苗情况,在中国地区只有两次是吻合的,有五次是不匹配的。在美国地区也只有四次是吻合的,有三次没有吻合,因此流感疫苗推荐的准确率很低。准确率很低的原因是在于流感病毒快速变异,从而导致其抗原性不断改变。
我们实验室通过流感的基因序列和流感的血清学结合起来发展了机器学习与网络模拟相结合的技术,大家看这是我们预测的流感的抗原,流感的疫苗改变的情况,它跟实验项结果是一致的。然后我们把这个方法发展成自动的医疗推荐方法,所以我们模拟流感它的抗原改变,在需要推荐疫苗的时候如果发现新的疫苗株会在下一个疫苗期间发展。
这就是我们推荐的疫苗,我们推荐的疫苗跟中国地区比较只有一次没有匹配,所以我们这个方法也申请了专利,同时我们这个方法现在也在向世界卫生组织发表。我们这个工作发表到国际杂志上以后得到了很好的表彰。同时新华社也报道了我国科学家发明流感疫苗株快速选择新技术、新方法。
我再花两三分钟时间介绍一下华东地区禽流感,这个工作我们也是和国家疾控中心和农业部合作完成的试点工作。我们知道2013年华东地区的H7N9发展的很快,当时病毒起源和发起的原因不清楚,之后我们进行了精确的分析,华东地区的H7N9基因很复杂,我们通过统计与遗传的推理,我们发现这个病毒通过两次重配现象产生的。第一次重配发生在2012年由欧亚起源的一个病毒跟中国地区的一个病毒进行第一次重配,然后在2012年早期的时候又到华东地区的家禽流行的H9N2进行第二次重配,然后形成了H7N9。所以我们的就阐明了H7N9是从野鸟传播到家禽,然后再开始传播到人,是这样一个途径。之后在国际上引起了很大的关注。
我们可以想像,健康医疗大数据的发展将来肯定不仅仅是对公共卫生的管控会提出新技术新方法,也对我们健康养生,也对我们未来的精准医学,个性化医疗提出新技术、新方法,由于时间的原因我就讲到这里,谢谢大家!