刘保延:数字化中医药信息系统研发的思路与实践

2017年4月13日-14日,由中国医学科学院 北京协和医学院主办,北京市卫生和计划生育委员会协办,中国医学科学院健康科普研究中心、中国医学科学院生物医学大数据中心、北京市疾病预防控制中心承办的“2017中国健康医疗大数据大会暨中国医学科学院生物医学大数据中心成立仪式”在北京天伦王朝酒店召开。

大会以“大探索、大发展、大融合”为主题,围绕大数据与医疗、健康中国建设、大数据健康医疗新模式、临床大数据以及大数据在健康领域的具体应用等为核心课题展开深入讨论,约1000余人参加了本次大会,其中参讲专家30余位、医疗机构400余家、行业媒体20家以及互联网行业代表200余人出席了本次会议。

liubaoyan

中国中医科学院原副院长刘保延

在下午的大数据助力智慧医疗发展论坛上,中国中医科学院原副院长刘保延教授发表了名为《数字化中医药信息系统及中医临床科研一体化平台思考与实践》的主题演讲。我们知道因为中西医疗法不同,中医治学在于变通,所以中医的临床实践是个体化的,不同病人有不同的治疗方法。由此刘保延教授介绍了对数字化中医药信息系统及中医临床科研一体化平台的思考与实践,并表示临床科研一体化是以数据为导向,问题为驱动,把医学实践和科学计算进行交替,以临床科研信息共享的平台系统作为支撑,通过数据进一步挖掘规律来指导临床,将它形成一个闭环。可以说数字化的中医药信息系统搭建了临床科研一体化的平台,让临床实践和科学研究能够紧密结合,使利用临床实际数据开展研究变成了一种可能。

刘保延教授还详细讲解了为构建数字资源的建设层和数据资源分析利用层所做的工作,此外他们还成立了中国中医科学院数据中心以达到进一步的实践应用。“在全国我们要建31个省级数据分中心,将它运用到全国的16000多个中医馆里去,全国中医馆统一用这样一个平台来收集数据、管理数据、分享数据。”

除此之外中国中医科学院数据中心还在寻求更大的发展空间。他们与安徽的科大讯飞合作,将语音识别系统用于调阅查询,并成立了一个联合实验室,专门研究问诊的语音识别,希望未来建立说写病例,实现数据结构化。这还能将每个病人不同的时点表现,他的一些干预方法,检验结果都罗列出来,使得医生一目了然,看到该病人在进展当中的病情变化情况。

小编对教授描述的的一个研究记忆尤深,他们将中医科学院一位治疗发烧效果非常好的大师薛世寿治疗发烧效果的800多个发烧病例收集起来,其中800多个病例涉及9500多个处方,再将他治疗发烧的9500多个处方数据进行挖掘分析,单从药味来看,仅1.8%的处方从药味,药物的组成上是一致的,这还不包括药量,如果把药量加上的话可以说没有一个病人的处方是一样的。中医治疗学博大精深,最后在刘保延教授呼吁大家能够中医药给予更多支出和关注时,我还沉浸在让中医临床实践实现数字化并集中到一个平台上是一件多么了不起的事情这样的感慨中不能自拔,相信未来中国中医科学院数据中心将会越走越远。

以下刘保延的演讲实录:

非常高兴有这么一个机会向大家简单介绍我们在中医药领域这两年做的一些工作和做这些工作的一些想法,以及目前一些进展的简单汇报,希望能够和大家很好的进行交流。

我的题目是数字化中医药信息系统及中医临床科研一体化平台的研发思路与实践。我本人现在也是在中国科学院中医药数据中心负责数据中心的工作,同时我们这个团队一直在做中医药的临床疗效评价的研究。

从这张图可以看到现代医学和中医药学有它各自不同的发展道路,不同的发展道路决定了它各自的优势,各自的特点,以及各自对信息化的依赖和需求。

中医药的特点,我想它在研究的范式上有它特殊的研究范式,我们把中医药的研究范式叫做真实世界的临床科研一体化,这种特征就是临床科研一体化的复杂范式,这种复杂范式为什么说它是临床科研一体化?大家可以看一下这张简图,这张图是咱们经常见的图,叫阴阳圆,代表了阴阳的平衡。在中医药的研究当中,我们所有的发现,所有的发明或者所有的实践都是在临床当中产生的,所以我们经常说中医从临床中来到临床中去,这样的一个学科。而且中医药有一个很大的特点就是个体化,我们曾经做了一个研究,在我们中医科学院有一个大师叫薛世寿治疗发烧效果非常好,后来我们把他治疗的800多个发烧的病例收集起来,其中800多个病例涉及到9500多个处方,把他治疗发烧的9500多个处方进行一个分析,单从药味来看,只有1.8%的处方从药味上,药物的组成上是一样的,这还不包括药量,如果把药量加上的话可以说没有一个病人的处方是一样的。也就是他看了800多个病人,看了9000多人次,这里面没有一张处方是一样的,说明什么问题?说明他是个体化治疗,当然大家说个体化治疗有没有规律,能不能发现规律,这就是我们需要做的一项非常重要的工作。

既然中医的临床实践是个体化的,可以说对每一个病人来说,对中医又是一个创新,它都需要研究,对这个病人不能照猫画虎,你要根据这个病人的一些反应、表现和你自己的一些思考来决定这个病人到底用什么样的治疗方法。所以说每一个病人里面都有创新,都有成功多经验,也有失败的教训在其中。怎么把这个实践的东西,通过这个实践进一步来总结里面的经验和教训,指导他下次临床。这个工作原来都是靠人脑来记,靠学生自己,当然后来到了老中医很有学问了,没到老中医的时候就靠自己脑子里面记,靠他的思考和思索,所以我们中医有的时候经常说一句话,说中医看病看这个人有没有悟性,悟性高掌握的就好,这里面就是说他多这种思索完成靠他自己的经验积累,他的记忆来进行搜索的。

那么有没有可能把这种个体化过程,他的一些东西,这些信息变成数字化的,把这些数字化里面的规律挖掘出来,不断丰富它,让他的经验扩大,教训变成进一步成功的起点?我想这就是我们在研究中医的方法时,我们觉得这是中医的一个特点,个体化治疗是他一个特点。那么这种特点能不能把它发挥到极致,让他对每一个病人的治疗都能得到一个很好的效果。所以说我们这种方法不能用简单的范式来做,而要用复杂的范式,这种范式是以人为核心,临床科研一体化的,是以数据为导向,问题为驱动,把医学的实践和科学的计算来进行交替,以临床科研信息共享的平台系统作为支撑,来实现从临床中来到临床中去这么一个过程。

根据这样一个思路,这也是我们的一个思考。为什么做这件事情的一个思考。平常的工作刚才说了跟名师、做临床、读经典、有悟性,这是中医的一个特征,但这些特征的特点是临床和科研是一体的。现在如何借助信息技术,让这个一体更加有效的发挥出来他的作用,让他更快的完善他,来构建这个体系。所以我们在这个研究当中我们感觉最根本的问题就是怎么把中医的临床诊疗过程给它数字化,给它数据化。为什么?因为中医整个的整料过程可以说是从数据到信息,从信息到知识,从知识到决策,从决策到智慧,这么一个信息转化的过程,所以数据的产生是它的核心。

怎么来构建这样一个核心就成为我们这个数字化中医药信息系统研发的一个最基本的思路。在这样一个思路下我们就借助现在的信息技术,来把这个平台搭建起来,让中医人机有机结合,让计算机帮助中医做更多的事情。我下面把这个系统的研发具体情况给大家做一个介绍。

我们整个数字化中医药信息系统要达到刚才我们所说的这个,从临床实践当中产生数据,通过对数据的利用来进一步的挖掘规律,来指导临床,把它形成一个闭环。怎么做?我们主要是两大块工作:第一,数字资源的建设层。它主要的目标是什么?就是把临床过程、诊疗过程数字化,这是第一个层次所要做的事情。第二,数据资源分析利用层。这个层主要的目标在于把临床复杂的数据如何找出它的规律,如何来分析利用它,这是两个层。

具体的构建大家看到在数据资源层里面,怎么让诊疗数据数据化,我们的思路是这样的。就是首先要建立个高度结构化的电子病例系统,以病人为核心把他诊疗的过程产生的信息全部规范的记录下来,同时把它变成一个可分析的数据。要做到这一点,首先要建立一个中医临床术语的应用系统,如果没有个规范的术语应用系统的话,你这个结构化的电子病例是不可能实现的。我们第一步来完成中医临床术语的应用系统的构建,其实这个系统大体上有这么几个部分构成的,核心是中医临床术语集,主要是把中医在临床当中所涉及到的一些术语规范化,把它的上位词、下位词,以及左位右位的东西全部确定下来,建立一个可以说中医临床术语的这样一个本体的数据库。在这个术语集的层级下,我们进一步在电子病例当中再建立一个叫中医临床术语字典,这个术语非常小,一个术语一个术语是单一的,但是到了术语字典的时候它就和临床贴的更加紧密了,把临床当中所要用到的东西放到术语字典里面。在术语字典的支撑下我们又通过基本元素和复合元素这样一些方法,再通过模板编辑器来建立一个结构化的模板,通过这个模板再来书写电子病例,最后形成结构化电子病例以后产生了这些数据,在前处理的时候我们还要通过临床术语集进一步对我们这些术语,对我们所收集到的这些数据给它进行规范,进一步给它进行分解,进行预梳理,这样就形成了我们这个临床术语应用的一个体系。

具体大家可以看一下,这边是我们建立的临床术语集,到现在为止已经有了39万条术语,而且每一条术语,你从这个术语出发就可以看到这个术语来源于什么地方,它的上位词是什么,下位词是什么,它跟其它词的关系是什么。这39万条术语全部建立一个这样的关系。在这个基础上我们又进一步的浓缩和临床的具体应用结合起来,又建立临床术语字典,术语集是独立在电子病例之外的,而术语字典是和我们的电子病例系统结合在一块的一个组成部分。现在目前的术语字典我们已经有了19万多条中医的术语,在字典中。在这个基础上我们进一步对术语进行整合,建立基本元素,现在有了900多条将近1000条的基本元素,在基本元素的基础上再建立复合元素,通过复合元素进一步建立我们的模板和不同的模板体系,个人模板、科室模板等等,到现在为止我们已经有了300多个复合元素,有3000多个模板。这是第一步,有了术语了。

第二步在术语的支撑下我们建立一个高度结构化的电子病例,这个电子病例包括了我们一般的功能,所有的电子病例需要具有的基础功能,电子病例要写病例,要对病例进行管理,这一部分它具有。同时我们把它叫做临床科研一体化的载体,那么它怎么体现把临床和科研紧密结合起来,这样一个特殊的功能。大家看一下这是我们的基本功能,这个基本功能可以说是我们一般的电子病例我想它都是需要具有的,比如用户的授权、认证、分级管理、数据存储管理、字典管理等等,这是一般的电子病例都要具有的。而我们主要的功能包括了电子病例的书写功能,以及电子病例的检索查询,还有痕迹的保存、打印等等,这些功能我想它都是具有的。

在这个基础上结构化是我们的核心,如果没有结构化就没有数字化,病例写完了变成文本放在那要用起来难度就比较大。首先要结构化,结构化里面程度越高,便捷性、书写的速度和医生的思维习惯的矛盾就越突出。怎么把这些东西解决好?让大夫用起来很顺畅,同时把速度还能够赶上大家的耐受力,我们在这个地方做了大量的工作。大家看到我们用了多种方法,这里大家看到多种勾选的方法,多种选择的方法,以及把主素和思维联想起来的方法,还有专科病例勾选的方法等等。到目前为止写一份高度结构化的电子病例,大病例一般20多分钟熟练的话就应该没问题可以完成的,如果是和预诊系统结合起来的话它的速度可以再提升。总体来说从医生一开始的不接受,到现在大家基本上感觉到很顺畅。而且咱们原来的文本病例粘贴往往贴错了,现在结构化的病例这种事情已经不会再出现了。

因为我们做的主要是结构化电子病例系统,HIS、LIS、PACS、RIS这些原来医院都有,我们要把这些镶嵌到这些系统里面去,所以我们用镶嵌的模式把医院里面和病人相关的信息全部整合起来,整合为一体,这个就不详细说了。

病例的质量控制从医疗角度来说是非常重要的事,它和每个大夫的奖金收入都是挂钩的,所以这个东西怎么做好?让医生感觉对他来说是个帮助,这也是我们一个很大的任务,所以我们从基础的质控一直到科室的质控到医院层次的全院的质控,让他非常灵活的通过这里面的一些选项,计算机帮助你提示的方法来保证基本上可以使每个病例的合格率达到100%这样一个程度。

在中医这个角度,我觉得我们中医的电子病例当然和西医的病例有大多数的共同特点以外,而且中医的电子病例基本上都是中西医结合的,就是我们西医内容要有,中医的内容还要有。所以我们在中医的内容方面做了大量的研发工作,比如说对药物,可以把药物的药名写出来,具体的药方名写出来药就出来了,完了可以加减,把上一次的药自动调到这一次来,把门诊和病房联动起来等等,这些方法在我们这儿都可以得到实现。在我们舌象、脉象、针灸里面,你选的穴位直接就可以选在上面。再有我们现在也有一些舌象仪、脉象仪也可以通过病例整合到里面去。

大家知道病房的病例比较容易做,而门诊的病例是一个难点。但是对我们中医来说,门诊老中医这些门诊的病例数据对我们研究来说更加重要,所以怎么来开发一个比较适合门诊思路的病例对我们来说也是一个考验,所以我们也开发了门诊的电子病例系统,这个系统基本上可以满足我们对老中医经验的一些初步的总结、挖掘和整理的一些工作。

再一个我们把移动电子的方法也用在我们的病例的调阅查询,最近我们和安徽科大讯飞合作,把语音识别系统也用到我们的调阅查询里面来,而且成立了一个联合实验室,专门来研究问诊的语音识别,我们希望建立一个将来是说写病例,在他说的当时把病例写出来,而且变成结构化,这些工作我们现在也正在逐渐的完善,正在做,这个也是把我们每个病人不同的时点,他的表现,他的一些干预方法,检验结果都罗列出来,让医生一目了然,看到这个病人在进展当中他的病情的变化情况。

在科研辅助方面也是我们的一个非常重要的内容,所以我们在这方面做的工作,第一个我们对病例,科研的病人,不是每个病人都有科研价值和科研目标的,对于有科研目标的这些病例能够进行很好的科研管理。再一个这些病人来了以后,虽然是一般的住院病人,他也可以把他分为不同的方案使用,随机化的管理。还有病人的随访,离院以后的随访管理,还有患者结局的管理,对于我们的疗效评估来说都非常重要。以前这些东西大家都没有记住方法,现在我们也研发了自动化的量表、床旁的填写和记录的设备来做这些事情,为我们的结局的管理也奠定了非常好的基础。

我们现在搞临床研究基本上是用临床观察表的方式记录患者的信息,而临床观察表是二次记录的方法,原始的东西往往可能还是有一定差别的,所以咱们现在所看到的说你这个病例有造假的现象,往往是在二次填写的时候可能会出现一些漏洞。那么我们就希望什么呢?既然我们的病例是结构化的,能不能自动的从我们的病例里面生成临床观察表,大夫不要去填了。根据这样的需求我们开发了临床观察表的自动生成和指控的工具。根据这样的工具就可以定制这个病人如果是个观察的病人,它可以自动的根据病人的病情变化,把他的信息填写到观察表里面去,不用自己再去填写。从纳入排序标准到他的各项指标记录等等。填完以后质量到底怎么样,我们还有一个专门的质控系统看质量到底怎么样。

对于中医的临床路径如何来进行管理,这也是我们做的一些工作,这些工作也在我们的一些医院里面实施。还有我们这些病人除了医院里面以外,院外其他医院的病人如果想把他的病例收集起来我们现在建立很多联合体,不可能每个医院把咱们的病例系统都装上,怎么办?我们又研发一个叫病例的登记系统,就是把其他医院的病人通过一种简单的方式,把他们的信息收集起来,这个是我们在东城医院(音)做的一个工作。

有了这些数据以后有两条途径可以使用,一条路径是有了数据了可以直接把数据导出来来进行分析,另外一条路径是可以走数据仓库,数据挖掘的道路。直接导出来的话对于病例的解析可能就是非常重要的一项任务,所以我们就研发了数据解析的方法,哪些病例需要分析,通过解析的系统很容易把数据导出来进行分析。当然你说进一步来做它的分析就是咱们下一个系统的工作。上面的这些介绍就是我初步的的为大家介绍一下,就是我们怎么把临床诊疗过程的信息给它数字化,这是我们做的一些工作。

在这个基础上有了这么多数据,怎么利用这些数据?在我们的研发当中进行了第二步工作,就是数据资源的分析利用工作。这个工作大家看到我们是以数据仓库为核心,当然在进入数据仓库以前对数据要进行前处理,或者叫预处理,预处理完了导进来以后,有了大量数据以后,首先看一下这个数据到底有什么东西,所以我们又建立了在线的检索、查询和展示的一个系统,让人了解你这个数据里面到底有什么,从不同的组合可能会出现什么等等。进一步对一些隐性的知识我们又建立一些模型,来帮助你分析这些隐性知识当中可能潜在的一些规律等等。

这是我们的中医药数据预处理的系统,这个系统目前已经处理了有10多万份病例,而且我们建立了有关的规则有100多万条,也为几十个课题提供了我们的服务。它包括了这么几大部分内容,大家可以看一下。从健康互相之间的关联关系,还有任务批量式的数据导入,第一部分是匹配,第二部分就是批量的导入,建立规则。这是它的影射情况,调用功能,导入以后数据的核查和原始数据之间的核查功能,再是标准数据的转换功能。通过这样一个系统基本上实现了我们可以定制批量的把数据导入到数据仓库里面来,保证数据仓库的肯定性变成非常好用的数据。

有了数据仓库以后,我们又建立了临床数据多维检索查询与展示的系统。大家看到首先把他们数据之间的关系建立起来,在这个基础上我们就可以通过这样的方法把你所要的数据项拖动过来,选择你要展示的图像等等。它到最后就可以根据你的要求把你的数据给展示出来,你的数据到底什么功能,什么内容等等,它要进一步为你的数据分析,来整理数据奠定这么一个工具。

对于数据挖掘分析来说其实也是一个非常重要的功能,就是一些非常潜在的隐性的知识怎么发现,我们建立了中医数据挖掘分析的平台,通过这个平台我们目前建立了三类10种模型,帮助发现老中医的经验当中比如说核心的处方是什么,加减变化的规律是什么,疗效怎么样等等,这样模型方法。举个例子,比如老中医的核心处方,老中医加减变化的规律,我们现在目前进行了40多位老中医他们经验的整理和研究。

我们这个系统目前可以说也在几十家医院当中使用,这里面比如像我们来研究中医里面叫政治规律的研究,像在于对中风病他的早期病情不断地在变化,变化有没有拐点?有没有说我要改变我的治疗方法的时候,我们通过这个研究之后发现6-8天的时候往往是他症候变化的拐点。像这样的研究用以前的方法很难发现。

再就是对老中医的经验,他的核心处方是什么,治疗某一个病怎么加减变化,这样的方式我们通过这种方法都可以找得到。比如老中医治疗冠心病用什么药,怎么加减的,我们从他的很多病例当中分析挖掘,发现他常用的处方有16个药,怎么加减变化有它很多的规律。当然在这个基础上我们也形成了12项的专利,17项的软件著作权等等。也形成了55项的这些标准和规范来支撑我们这个发展。

目前我们在可以说几十家医院当中,这是我们全国的一个中医临床研究基地,国家支持的。不是三甲的大医院,里头一两千张病床他们现在的情况,在这个系统支撑上,他们开展了一系列的研究,来分析临床的实际数据当中看他们的规律是什么,通过这个研究又进一步知道他们临床的实践,这是他们开展研究的一些具体情况。到目前为止我们利用这个系统建立了这个病例的模板,已经有了6200多个,然后也形成了临床术语等等应用的一些专科术语等等。

在这个基础上我们感觉光有系统还不行,必须还有机构,能把大家的数据给它汇集起来,这样进一步应用。所以我们又成立了中医药的数据中心,虽然我们叫中国中医科学院数据中心实际是承担着全国中医药的数据的汇集、管理任务。这次我们数据中心在刚才数字化重要性系统的基础上进一步研发了中医馆的健康信息平台,也就是把我们的从电子病例到辅助开发,到这一套系统给它用到基层的中医管理里面去。到目前为止这个系统我们要涉及到什么呢?就是在全国我们要建31个省级数据分中心,把它运用到全国的16000多个中医馆里面去,全国这些中医馆统一用这样一个平台来收集数据、管理数据、分享数据。每天从我们这个地方数据中心,就可以看到全国他们在这方面的应用情况。

这是数据交换的情况,这是里面的一些,就是怎么把数字化重要性系统用到我们的电子病例,变成知识库这里面去,这是我们现成开发好的这样一套体系。

总而言之,可以说数字化的中医药信息系统它搭建了临床科研一体化的平台,让我们的临床实践和科学研究能够紧密的结合,使利用临床实际数据开展研究变成一种可能。

2015年的时候刘延东副总理到我们中医科学院成立六十周年纪念大会上的讲话谈到科技成绩时指出建立临床科研一体化的中医药数据采集、管理与分析系统,推动了中医药学术进步。她也给我们这个工作有充分的肯定。

同时也对我们在座的诸位,希望大家能够对我们中医药更加的关注,给予我们更多的支持,谢谢大家!