文档

生命医学企业圣庭医疗,利用云上高性能计算提效降本

更新时间:
一键部署

圣庭医疗通过上云优化了传统IDC集群的数据可靠性、运维成本及效率问题,基因比对与分析效率提升了70%。阿里云高性能计算团队还通过结合Slurm业务工作流dependency与自动伸缩的结合,减少了无效的计算资源浪费,有效降低了使用成本。

客户案例封面图

公司概况

公司名称:圣庭医疗

公司地址:www.shengtinggroup.com

公司介绍:圣庭医疗是一家提供基因检测和医疗解决方案的高新企业;专注于开拓前沿分子生物学技术和高性能计算在生命科学研究和人类健康领域的应用,致力于成为全球先进的基因组学、系统生物学和生物信息学研究解决方案的提供者。

圣庭医学检验所已经推出了包括无创产前 DNA 检测、 ctDNA 检测、 NGS 肿瘤个体化用药指导基因检测、第三代纳米孔病原感染检测、血液病基因检测、乳腺癌/卵巢癌基因检测在内的一批优秀的高通量测序临床应用项目,已在生育生殖健康、肿瘤个性化诊疗,靶向用药,病原感染和基因检测等几大方向形成了优秀的产品体系和品牌效应。

圣庭技术团队汇集了国内外优秀的基因组学及医学专家,有多学科人才组成的合理技术梯队,并与广大科研/临床单位合作了多项临床科学研究,累计发表了超过130篇 SCI 文章,总影响因子超过600,在精准医学领域赢得了广大合作伙伴的高度认可。

业务需求与痛点

最早,科学家利用光学测序技术进行基因检测,一次检测便价值不菲。如今,基因测序成本大大降低,并广泛应用到精准医学、癌症早筛、育前检测等多个领域。这个过程离不开计算机科学与芯片的进步。

在获取到血液等生信样本后,科学家或研究员需要利用基因测序仪器先对其进行化学处理,在反应后对相关的数据收集与分析,生成基因组的文本数据。此时,要进一步发现基因组的特点或异常,提出精准的建议,还需要利用计算机将该基因测序文件与大量生物信息库中的参考基因数据进行对比。

作为一家基因测序企业,圣庭医疗对算力有着如下诉求和痛点:

1、海量、丰富的算力需求:人类基因组数据量极为庞大,单个人类单个基因组的FASTQ文件,就已经高达100G。针对不同的测序目的,还会对应不同的分析流程、软件,甚至底层的不同算力类型。高性能计算集群与调度软件必不可少。

2、运维成本高:原来,圣庭医疗使用开源的HPC相关软件,需要自行对开源调度器和用户管理软件等进行运维,损耗了大量的运维人力,因此,圣庭医疗希望上云解决这类苦恼。不仅能得到IaaS资源的运维及稳定性保障,同时也希望能在不改变HPC使用习惯的前提下,获得HPC生命科学PaaS层的软件运维支持(主要包含调度器、用户管理软件等)。

3、排队时间长,希望随时扩缩容,降本增效:圣庭医疗原来使用的线下IDC机房与产品,时长面临着计算任务过多时需要资源排队等待;或者计算资源规格不能很好匹配上层计算任务,影响了计算效率和利用率;计算任务低谷时则出现任务闲置,造成浪费。在基因数据的计算过程中,可能会有部分任务之间有依赖,部分任务需要等待其他任务的结果计算出来后才能开始计算,在等待过程中造成了资源限制与浪费。圣庭医疗希望阿里云能帮忙优化软件流程与特性。

解决方案

客户案例架构图

阿里云为圣庭医疗提供了面向生命科学行业的计算解决方案,包括IaaS层的丰富算力与PaaS层的弹性高性能计算平台E-HPC,节省了圣庭医疗的运维与使用成本,提升了计算效率。

方案细节如下:

1、强大、丰富的算力类型:阿里云弹性计算,根据不同的CPU、内存、网络、存储等资源配比,有着丰富的底层实例,可很好地满足圣庭医疗不同的作业流程所需要的算力特性,尤其是基于持久内存技术的实例产品ecs.i4p,其优异的性能以及数据持久化存储的特性,可以很好地满足海量基因组数据需要缓存的场景。

2、高效便捷的自动化运维能力:阿里云弹性高性能计算平台E-HPC可灵活共享所有ECS规格资源,一方面能兼得阿里云IaaS层ECS的运维及稳定性保障支持;一方面又保持与原线下IDC HPC集群使用习惯一致。阿里云弹性高性能计算E-HPC PaaS平台,可以一键配置部署弹性高性能计算集群,同时提供资源管理、作业管理、用户管理等运维支持,用户可以根据需求设置流程、算例作业调度策略。

3、弹性伸缩,降本增效:E-HPC平台能灵活基于生信业务负载与需求,自动扩缩容相应规格及数量的计算资源。在作业高峰时平台可以进行扩容,无需资源排队,提升效率;在低谷时平台可自动缩容,节省成本。

4、结合场景的深度优化服务:阿里云EHPC集成了生命科学行业常用的高性能计算调度器Slurm,供客户管理HPC作业资源管理,并实现了基于Slurm的dependency特性,即先检测无依赖的作业,其他作业待依赖作业执行完成后再适时扩容执行。生信业务流依赖管理结合自动伸缩,合理降本增效。

客户效益

圣庭医疗通过上云优化了传统IDC集群的数据可靠性、运维成本及效率问题,基因比对与分析效率提升了70%。阿里云高性能计算团队还通过结合Slurm业务工作流dependency与自动伸缩的结合,减少了无效的计算资源浪费,有效降低了使用成本。

1、满足了客户传统HPC集群上云需求,并优化了传统IDC集群的运维成本及效率问题,实现客户业务工作流dependency与自动伸缩结合的需求,减少了无效的计算资源浪费,有效降低了运维成本与使用成本。

2、解决客户云上的资源排队等待问题,可灵活选用通用、计算、内存型等计算资源,且结合自动伸缩,大大提升了计算效率。

选用产品

弹性高性能计算E-HPC

弹性高性能计算(E-HPC)基于阿里云基础设施,为用户提供一站式公共云HPC/AI平台服务,面向科研、生产、教育和行业大计算,提供快捷,弹性,安全和与阿里云产品互通的云超算平台。

更多关于弹性高性能计算E-HPC的介绍,请参见弹性高性能计算E-HPC产品详情页

云服务器ECS

云服务器(Elastic ComputeService,简称ECS)是阿里云提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别云计算服务。云服务器ECS免去了您采购IT硬件的前期准备,让您像使用水、电、天然气等公共资源一样便捷、高效地使用服务器,实现计算资源的即开即用和弹性伸缩。阿里云ECS持续提供创新型服务器,解决多种业务需求,助力您的业务发展。

更多关于云服务器ECS的介绍,参见云服务器ECS产品详情页。

批量计算

批量计算(BatchCompute)是一种适用于大规模并行批处理作业的分布式云服务。可支持海量作业并发规模,系统自动完成资源管理,作业调度和数据加载,并按实际使用量计费。广泛应用于电影动画渲染、生物数据分析、多媒体转码、金融保险分析、科学计算等领域。

更多关于BatchCompute的介绍,参见BatchCompute产品详情页

(注:封面图来自圣庭医疗官网)

  • 本页导读