本文介绍了阿里云基因分析平台集成的第三方软件(Sentieon)的使用方法。

关于Sentioen

​Sentieon® 成立于2014年,拥有算法、软件和系统调优的专业团队,开发了众多高度优化生物信息分析应用,获得precisionFDA组织的挑战赛的冠军,并在大学、医院等知名机构中得到广泛应用。

软件功能

基因分析平台集成了Sentieon所有软件的功能,包括Sentieon® DNASeq®, TNseq®, and TNscope® 系列,可以支持如下常见的分析场景:

Alignment

Sentieon® BWA matches BWA-MEM with >2X speedup.

Germline SNV/INDEL Variant Calling

DNAseq®: PrecisionFDA award-winning software. Matches GATK 3.3-4.1, and without downsampling. Results up to 10x faster and 100% consistent every time.DNAscope: Improved accuracy and genome characterization. Machine learning enhanced filtering producing top variant calling accuracy.

Somatic SNV/INDEL Variant Calling

TNseq®: Matches MuTect, MuTect2 v3.8 - 4.0 without downsampling for higher accuracy and improved detections of low allelic fraction variants.TNscope®: Winner of ICGC-TCGA DREAM challenge. Improved accuracy, machine learning enhanced filtering. Supports molecular barcodes and unique molecular identifies.

Structural Variant Calling

Germline and somatic SV calling, including translocations, inversions, duplications and large INDELs.

Joint Calling

Supports large-cohort joint calling of over 200,000 WGS samples directly from gVCF and without intermediate steps.

BCL-FASTQ Tool

Sentieon®'s external library accelerates BCL to FASTQ conversion by 1.5 - 2x.

RNA Variant Calling

Matches GATK RNAseq variant calling Best Practices.

使用方法

基因分析平台通过提供公共应用的方式大大简化了Sentieon软件的使用,并保留了软件所有的原生功能,同时支持用户使用Sentieon进行定制开发。用户只需要按照以下几种方式之一,即可使用Sentieon来分析基因数据或开发加速应用。

  1. 直接通过应用仓库安装Sentieon各分析流程:

image.png

用户也可选中某分析流程后点击进入,选择该流程的不同版本:

image.png

目前基因分析平台在各个区域提供"201911"、"202010.02"、"202112.05"、"202112.06"以及"202308"版本的Sentieon供用户使用。

  1. 自定义Sentieon流程:

用户也可参考公共应用中的Sentieon流程定制自己的Sentieon应用,仅需在WDL的runtime属性中通过software字段指定Sentieon版本即可,command中支持Sentieon的各种原生用法。

runtime {
		software: "sentieon:202308"
}

如:

image.png

  1. Sentieon详细功能介绍请查看Sentieon软件的命令和用法