随着第三代基因测序技术的引入,生物信息学的研究领域得以广泛拓展,为深度挖掘基因信息提供了更多的可能性,同时,也带来了海量的数据分析和处理任务。
北京希望组生物科技有限公司(下文简称希望组)在打造全新的三代测序项目交付平台时,引用火山引擎 Bio-OS 解决方案,建立了基于 web 的生信数据分析平台,不仅有效降低生信数据分析门槛,也使售后人力成本降低了40%,运维成本降低了30%。
希望组(Grandomics)是全球知名的三代测序技术拓展者,也是中国首家三代测序服务公司。多年来,一直专注于在三代测序平台上进行技术开发与应用拓展,其自主开发了基因组变异分析系统、单细胞测序技术等多项三代测序软件和技术,并构建了三代测序高性能计算集群,为客户提供优质的第三代测序分析和存储服务。
第三代测序发展迅速,底层调度迎来挑战
近年来,第三代测序技术迅速发展,为基因组研究提供了高分辨率的数据。希望组致力于打造一个三代测序项目交付平台,通过可视化界面帮助用户进行生信数据分析,降低难度、提高效率。然而,生信数据分析流程复杂,计算任务多且波动大,需要处理海量非结构化文件数据。因此,希望通过异构集群纳管调度能力,实现资源复用,降低成本,提升集群扩容的便利性。
火山引擎Bio-OS,助力生信数据分析
在火山引擎 Bio-OS 解决方案的支持下,希望组成功构建了基于 web 的生信数据分析平台。该平台不仅能够充分利用现有的本地计算资源进行生信计算,同时也方便其客户通过 web 页面提交自己所需的生信分析流程来获取分析结果。该平台拥有无缝集成弹性容器、海量实例快速秒级启动、灵活应对计算高峰等特性。此外,这些特性的引入也有效地缩减了售后支持方面的人力成本。
生信数据分析平台的三大优势:
降本增效,资源利用:希望组引入 Bio-OS 方案,通过将本地的 SGE 集群纳入私有集群的管理范围,将旧有的计算资源转化为有价值的资源,进一步提升计算效率,减少资源浪费,降低维护成本。
流程简化,操作追溯:Bio-OS 通过在工作流中预置一系列分析步骤,希望组成功降低了生物信息学数据分析的门槛。实验人员和医生等非专业人士也能够轻松地启动复杂的数据分析流程,不需要深入了解技术细节。同时,通过 git 管理工作流的不同版本,确保了操作的可追溯性和回顾性。
容器集群,智能管理:在计算资源管理方面,火山引擎的 Bio-OS 方案引入了弹性容器,使系统能够快速启动和停止计算实例,以适应计算任务的变化。特别是在处理计算高峰时,依然能够保证系统高效运行,不会因为负载增加而陷入延迟。
售后成本降低40%,运维成本降低30%
生信数据分析平台,有效降低了生信数据分析的门槛,让普通人员也可轻松开启数据分析之旅。另外,Bio-OS 纳管本地 SGE 集群的功能实现本地算力的充分利用,在提升集群管理效率的同时,降低了40%售后支持人力成本和30%运维成本。
目前,希望组在 Bio-OS 平台集成的 notebook 工具基础上,还开发了诸如花瓣图、动态火山图、单细胞基因表达降维图、单细胞降维分群图工具等。随着技术的不断演进,基因测序和 Bio-OS 的结合,将扩展我们对基因组含义和应用的理解,并创造出更多的发展机遇。
END
日前,火山引擎与基因会等六家生信领域企业,共同发布了《2023基因行业蓝皮书》。未来,火山引擎将持续为科技研发提供支持,为生物信息领域的创新发展注入更多的动力。
更多详细内容,请点击阅读原文,下载《2023基因行业蓝皮书》。
阅读原文链接:
https://www.volcengine.com/docs/6624/1109238