“2019中国医院协会医学工程专业委员会学术年会暨第四届PLAGH-MIT医疗大数据学术交流及Datathon活动”,2019年11月14日至17日在北京石景山景园假日酒店举行。该活动由中国人民解放军总医院联合麻省理工学院、哈佛医学院、清华大学数据科学研究院、《中国医疗设备》 杂志社、中国医院协会医学工程专业委员会、北京生理科学院危重症医学专业委员会共同举办,Datahon环节引入了和鲸科技和AWS作为技术支持方,分别提供数据科学协同平台与云资源支持。
本次Datathon活动分为赛前培训、课题路演、团队招募、成果展示和评审颁奖六个环节,这个过程需要在几天内完成,不仅考验了每一位参赛队员的专业技术能力,更考验了每个团队的协作配合。
11月15日晚,课题路演正式开始,来自全国各地的队长纷纷登台,每个人用120秒的时间针对自己团队课题进行路演展示,并在现场招募队员。本届Datathon课题是临床方向,队长大都为临床医生,大量与临床医学密切相关的课题被提出。由于算法工程师和数据科学家的数量稀缺,他们成为了招募现场的主要对象。
经过三个半小时紧张激烈的路演与招募,24个由临床医师、算法工程师、医疗大数据工程师组成的跨领域队伍集结完毕,队员们针对问题作出积极讨论,开启了接下来为期两天的跨界研究工作。为期两天的活动时间十分紧张,为了能够得到有价值的研究成果,各个队伍的成员们废寝忘食,毫不懈怠,为了课题进展讨论至深夜。
值得一提的是,每届Datathon活动都会有来自MIT,哈佛医学院的国外专家团队给队伍提供指导,专家们有着丰富的医学及数据科研经验,他们把每个参赛小组的课题进行逐个讨论,探讨题目的可行性、实验设计的合理性、研究方向的创新性以及课题与所用数据库的关联,并根据实际情况给出切实可行的建议。
课题初审之后,这些国内外的专家还被分配到各个参赛小组,一对一辅导参赛团队,针对每个团队的优势和短板提出解决路径,确保课题方向优中选优,帮助各团队绕开弯路,提炼灵感,进一步促成高质量结果。这个过程也像一次难得的开放式教育,通过引入国际化专家团队,帮助参赛者在较短的时间内掌握医疗数据科研选题方法和数据分析技能。
在课题研究过程中,每一位成员都要或多或少地接触到数据分析,不同角色之间也需要基于数据进行协作,而一个能满足团队协同的数据分析工具显然对研究起到了很大的推动作用,通过和鲸科技的“数据科学协同平台”K-Lab,让复合背景的团队协作在Datathon当中得以实现,产出基于数据科学方法构建的研究方案,并更深入地研究和完成最终成果。
经过两天的合力工作,各个团队最终都产出了自己的研究成果,并以PPT形式进行汇报,来自哈佛、MIT和301医院的专家代表团为各个队伍打分和提出评审意见,评审和打分流程都基于K-Lab平台进行,除了提交用于展示课题成果的幻灯片之外,每个队伍还需要基于K-Lab提交数据分析所用的代码,以保证成果可复现性,12支队伍最终脱颖而出。
颁奖典礼上,解放军总医院的张政波主任说:“Datathon活动其实不止是一次竞赛,更是一个学习交流的过程,大家在这次这个过程中思考、体会,发现自己的强项和不足,找到互补的团队和伙伴,推动学科的领域的科学研究,所有人在Datathon中都是赢家。”
活动最终评选出一等奖1项,二等奖3项,三等奖5项,分别由来自北京理工大学、解放军总医院、中山大学附属第一医院、浙江大学医学院附属邵逸夫医院、首都医科大学等单位的团队获得。
一等奖是北京理工大学辛怡教授带领的团队,他们研究的题目是根据ICU患者的生命体征和治疗方式预测血清钠的水平,因为钠离子是细胞外液的主要阳离子,血清钠对维持体内电解质平衡、酸碱平和和渗透压皮鞥恒起到关键作用,他们根据患者生命体征和治疗方式的血清钠建立了机器预测模型,并根据这一模型做出了演示APP应用。在两天时间内,这个成果是惊人的。
作为现场少见的算法出身团队,获奖团队的队长辛怡教授对表示,这是团队第三年参与Datathon活动了,第一年参加时是在其它团队中参与课题,第二年就将自己团队研究的课题带到比赛中,得到很多来自MIT和哈佛的教授评委的指点,所以今年团队将课题再次优化,并在现场进行临床医学和医学工程队员招募,将研究进一步落地推进。
“我认为Datathon是一个非常难得的机会,能够让学生们接触到在学校里无法尝试的完整项目,和整个团队一起,从提出问题到做出这个问题的解决方案,并且接触到医学背景很强的临床医师,让科研的深度和广度都得到提升。所以这次我不仅带上了我的研究团队,更带上了很多我的本科学生来学习观摩,希望每一位学生都要有一次这样的体验。”辛怡教授说。
为期四天的Datathon结束了,但跨学科的创新协作却刚刚开始。据悉,本次Datathon的成果,将会在进一步细化整理后,以论文形式公开发表,后续的合作也将持续进行。
数据科学的发展,使得医疗科研在研究方法、运作方式、传播交流等方面发生了深刻变革,能够熟练掌握大数据技术的医生,其科研成果也普遍有着更高的行业影响力。中国目前针对医疗领域的大数据教学,还处于起步阶段,Datathon这种能够促进跨学科人士交流、并提供完备的基础设施和数据素材进行开放式科研协作的活动,显得更加难能可贵。
随着数据的增加,值得科研人员探索的问题也在变多、变难,Datathon的开放科研模式,以数据为基础与协作为桥梁,建立起了多学科之间的深入合作,为科研工作的形态打开了全新的可能。