作者:Ed Wright ,赛灵思数据中心事业部市场总监
医疗服务提供商收集的数据量正在不断增长,并正在颠覆当前的数据分析方法。与此同时,跨表格和业务实体联网并识别隐含关系与模式的能力,为提升患者护理和患者疗效以及为医疗服务提供商降本增效方面,提供了诱人的突破。
使用图形数据库探索和分析互联数据的企业每天都在增加。图形数据库高度重视数据间的联系与关联,而关系型数据库和其他 NoSQL 数据库则对互联数据一片茫然,所以图形数据库能够更加深入地分析互联数据。图形数据库的知名度、对它的兴趣以及对它的评估与采用,继续领先于其他数据库技术。据 Gartner 预测,图形数据库将呈加速增长态势:“到 2025 年,80% 的数据和分析创新将采用图形技术,远超2021 年的 10%,这有利于在整个企业范围内快速制定决策。”1
世界最大的医疗公司与图形数据库
Tigergraph 是世界上处理速度最快,可扩展性最强的图形平台。在本文中,我们将探讨 Tigergraph 如何借助赛灵思硬件加速技术与图形分析库,助力世界最大的医疗公司整合来自 200 多个来源的数据,从而为每位用户建立完整的纵向健康史,以简化其呼叫中心的工作负担,并为用户提供实时治疗路径建议。
这家公司主要为客户提供医疗卫生服务、健康福利计划以及保险和金融服务,目前运行着美国最大规模的互联医疗图形数据库资产。该数据库有超过百亿个顶点,超过 500 亿个边,并为上亿会员保存最近 18 个月的数据,内容涉及赔付申请、临床交互、提供商、电话号码、上门服务等最新数据。该数据库拥有超过 1.2TB (太字节)数据量,并通过各类应用为 33,000 多位在线用户提供支持。
该公司采用 TigerGraph 的 Patient360 解决方案,通过呼叫中心客服快速高效地提供可靠的治疗路径建议。为了实时提供更优质、更高效的指引,他们的目标是将 20 分钟的呼叫缩短 10%,提高客户满意度并为呼叫中心节省 1 亿美元的成本。
数据库查询的功能之一是计算患者相似性。这种用例也就是所谓的医疗孪生。正在治疗患者的医生希望分析与自己的患者症状相似的其他患者,以确定治疗方案。为此,医生会搜寻能够匹配其患者的病史且疗效最好的具有最相似症状的患者。下面我们深入了解一下如何操作。
余弦相似性的重要性
对于所有类型的推荐引擎,相似性计算都是关键:试想一下,如果 YouTube ( 全球最大的视频搜索和分享平台 ) 为您推荐的是来自您最喜爱歌手的新视频、网飞 (Netflix,全球最大流媒体播放服务商)推荐的电影让您如获至宝,或是亚马逊推荐的产品与您的审美不谋而合,是您居家住房改造最需要的神器,这将带来难以比拟的实用性(以及愉悦度)。TigerGraph 在他们的 Member Journey 解决方案中使用余弦相似性算法,为客户提供同样的神奇效果。
让我们简单了解一下什么是余弦相似性,以及为什么这种算法对患者治疗路径建议有很大帮助。基于属性的相似性用于通过比较属性和结构,发现图形中最相似的项目。项目特征用数字表达,并以阵列形式保存在矩阵中。过敏、医疗程序、免疫和状况都是在这个用例下,可以构成阵列组元的属性类型。通过为阵列中的数字计数和计算权重,就能创建矢量。然后,将目标矢量(刚创建的矢量)与群体矢量进行比较,找出最接近的匹配项。
那么为什么是“余弦”相似性?当两个矢量间的夹角缩小,这个角的余弦值就趋近于 1。当两个矢量间的夹角缩小到 0,余弦值等于 1 (cos(0)=1)。另一方面,当两个矢量正交,余弦值就为 0 (cos(90)=0)。余弦值越趋近于 1,两个病史就越近似。
加速治疗路径
显然,如果能够根据数百种属性搜索数百万份患者病历以找出最相似的病历,从而推导出治疗路径,将为患者康复提供莫大的福音。如果能快速完成这项工作,可以让患者更加安心,并提高患者满意度,同时提升呼叫中心效率,节省大量成本。您处理的患者数量越大,实时完成这些工作的难度就越高。当您有 1 亿位患者,要及时找到最相似结果,并使之和人际间自然对话速度一样快,难度极大。在几分钟内获得结果,这是 TigerGraph 使用常规的基于 CPU 的计算架构所能实现的水平。这虽然足以令人印象深刻,但还是不能满足这个用例的需要。
这就是赛灵思技术的用武之地。赛灵思是 FPGA 领域的全球领先者。FPGA 是一种由可配置逻辑块矩阵构成的半导体器件。FPGA 的其他优势还有大规模并行,即能够同时执行多项计算。这使得 FPGA 成为计算密集型工作负载加速的理想选择。赛灵思 Alveo 加速器卡是标准的 PCIe 器件,非常方便在行业标准的服务器内部署 FPGA 协处理。本用例使用 Alveo U50 卡。借助赛灵思 Vitis 库,TigerGraph 等应用能够使用通用的高级语言,轻松灵活地为应用提供 Alveo 加速。
这就是赛灵思技术的用武之地。赛灵思是 FPGA 的发明者,也是该领域的全球领先者。赛灵思 FPGA 从架构上允许“度身定制”的适配,高度契合患者建议引擎使用的余弦相似性等计算密集型工作负载的独特需求。
赛灵思 Alveo U50 是一种基于 PCIe 的 FPGA 加速器卡,能够部署到行业标准的服务器内。该卡提供大规模并行 FPGA 处理能力,在计算余弦相似性算法时,通过快速访问存储患者病历的高带宽存储器 (HBM2),实现高速处理。这种方案与基于 CPU 的实现方案相比完成查询搜索功能的速度快出 300 倍以上。
将患者相似性查询从基于 CPU 的架构迁移到赛灵思 Alveo 卡可实现性能飞跃。查询响应时间从 1 分钟缩短到 50 毫秒。这既能够帮助这家医疗服务提供商实现缩短呼叫时间、节约成本的目标,也支持以人际对话的正常节奏将查询结果提供给客服,让患者与客服间的交流更人性、更自然。