阿里云基因计算AGS(Alibaba Cloud Genomics Service)是由阿里云推出极速、低成本、高精度的基因组测序二级分析的云服务,主要包括提供以容器平台为基础的生物信息工作流服务和无需搭建集群,开箱即用的加速API服务。本文介绍什么是AGS及其应用优势。

什么是AGS

AGS主要应用于基因组测序二级分析,通过AGS加速API只需要15分钟即可完成一个30X WGS的基因比对、排序、去重、变异检测全流程,相比经典流程可加速120倍,比目前全球最快的FPGA/GPU方案仍能提速2~4倍。

通过分析个体基因序列的突变机制,可为遗传病检测、肿瘤筛查等提供有力支撑,未来将在临床医学和基因诊断方面发挥巨大作用。人类全基因组有约30亿个碱基对,一个30X的WGS测序数据量大约在100GB。AGS在计算速度、精准度、成本、易用性、与上游测序仪的整合度上具有极大优势,同时适用于DNA的SNP/INDEL以及CNV结构变异检测,以及DNA/RNA病毒检测等场景。

更多信息请参见AGS产品详情页

ags-arch

AGS的优势

  • 极速、精准。

    经过实际测试,整套方案在15分钟内完成了8组30X WGS 样本二级分析处理。在保证精度的前提下,实现15分钟对7200亿碱基拼装、排序、去重、变异检测,完成基因检测全流程120倍加速。且通过NA12878测试数据集与金标准VCF比较,二级分析的精度高于或等于BWA-0.7.17/GATK 4.1.3的数据产出,SNP精度到达99.80%。

    AGS_overview_01
    数据集:30X NA12878
    SNP RECALL PRECISION F1
    GATK 4.1版 99.86% 99.79% 99.82%
    AGS版 99.86% 99.80% 99.83%
    INDEL RECALL PRECISION F1
    GATK 4.1版 99.28% 99.70% 99.49%
    AGS版 99.27% 99.68% 99.47%
  • 成本大幅优化。

    阿里云ACK/AGS提供云上PaaS加速能力,以混合云方式协助华大基因完成自主测序仪大批量下机数据二级分析。同时实现二级分析计算行业内低成本,缩短交付周期95%。

  • 适用场景广。

    在保证分析通量的同时满足灵活性需求,可根据不同平台和数据定制分析流程。为各大测序服务商、研究机构等提供更简单更高效的存储、自动化分析、数据传输、项目协作以及生物信息工具开发等方面的解决方案。

    AGS能够提供Kubernetes-native工作流机制,帮助用户在Kubernetes集群上运行支持DAG的工作流。在处理基因计算,数据计算等场景具有良好的通用性。

  • 简单易用。

    AGS凭借云端的自动伸缩特性,实现大规模弹性调度计算。在使用上,该方案用户无需关心基因数据处理过程中的计算资源、处理逻辑、数据缓存等细节,只需将下机数据(FASTQ文件)上传至OSS,以及授权Bucket给AGS服务,即可高效、快速完成整个数据分析流程,并将结果数据上传到用户期望的存储空间。

相关文档

除了上述所提及特点,AGS产品还成功解决了工作流程组装管理,海量数据存储、迁移与传输、安全合规等行业痛点问题。详情请参见以下文档。