本文介绍基因分析平台支持的运行时属性,并比较阿里云与其他计算后端的差别。基因分析平台目前使用WDL作为分析应用标准,用户可以通过每个Task中的runtime来定义计算作业所需要消耗的平台资源。
平台支持的运行时属性
基因分析平台运行时设置存在限制,请查看使用限制文档。
cpu
默认 1,代表计算作业需要的核数。
范例:
runtime {
cpu: 2
}
memory
默认 “2G”,代表计算作业需要分配的内存大小
范例:
runtime {
memory: "4G"
}
instanceType
可选,如设定则忽略task里定义的cpu和memory属性,直接指定特定的阿里云ECS实例类型,作为计算作业执行环境。所有ECS实例类型见实例规格族,具体实例类型需联系产品团队或提工单确认基因分析平台是否支持。建议使用cpu/memory方式指定资源。
范例:
runtime {
instanceType: "ecs.c6.xlarge"
}
disks
默认 “local-disk 40 cloud_efficiency”,代表计算作业执行环境中挂载的磁盘位置及大小,用于保存输入输出文件。
disks属性值为逗号分隔的磁盘信息,每个磁盘信息用空格分隔的三元组来描述,如“local-disk 40 cloud_efficiency”,分别代表:
挂载点,如数据盘挂载位置/cromwell_root或local-disk(local-disk代表系统盘,挂载位置在根目录/)。
磁盘大小,单位为GB。
磁盘类型,支持cloud_efficiency和cloud_ssd两种。
范例1:只挂载系统盘,local-disk挂载系统盘到根目录/,Cromwell工作目录/cromwell_root共享系统盘空间,此种方式适用于较小数据规模使用
runtime {
disks: "local-disk 100 cloud_ssd"
}
范例2:同时挂载系统盘与数据盘,数据盘挂载为Cromwell工作目录/cromwell_root,此种方式推荐处理大规模数据使用
runtime {
disks: "local-disk 100 cloud_ssd, /cromwell_root/ 500 cloud_ssd"
}
注意:平台兼容社区WDL中的HDD和SSD关键字,HDD对应高效云盘(cloud_efficiency),SSD对应SSD云盘(cloud_ssd)
docker
可选,计算作业使用的docker镜像,只支持阿里云的容器镜像服务。
范例:
runtime {
docker: "registry-vpc.cn-shenzhen.aliyuncs.com/easygene/genomes-in-the-cloud:1.0"
}
software
可选,计算作业使用的第三方软件,只支持基因分析平台的第三方软件列表。
范例:
runtime {
software: "sentieon:201911"
}
阿里云与社区其他计算后端比较
阿里云基因分析平台 | HPC | 本地环境 | |
cpu | ✅ | ✅ | ✅ |
memory | ✅ | ✅ | ✅ |
instanceType | "ecs.c6.xlarge" | ❌ | ❌ |
disks | ✅ | ✅ | ✅ |
docker | ✅ | ✅ | ✅ |
software | software: "sentieon:201911" | ❌ | ❌ |
阿里云基因分析平台计算任务的运行时基本属性与社区标准保持一致,方便应用无缝运行在本地、HPC和云环境中。并且额外提供instanceType扩展支持GPU/FPGA硬件需求,和software支持平台集成的第三方商业软件。
- 本页导读 (0)