本文介绍了阿里云基因分析平台集成的第三方软件(Sentieon)的使用方法。
关于Sentioen
Sentieon® 成立于2014年,拥有算法、软件和系统调优的专业团队,开发了众多高度优化生物信息分析应用,获得precisionFDA组织的挑战赛的冠军,并在大学、医院等知名机构中得到广泛应用。
软件功能
基因分析平台集成了Sentieon所有软件的功能,包括Sentieon® DNASeq®, TNseq®, and TNscope® 系列,可以支持如下常见的分析场景:
Alignment | Sentieon® BWA matches BWA-MEM with >2X speedup. |
Germline SNV/INDEL Variant Calling | DNAseq®: PrecisionFDA award-winning software. Matches GATK 3.3-4.1, and without downsampling. Results up to 10x faster and 100% consistent every time.DNAscope: Improved accuracy and genome characterization. Machine learning enhanced filtering producing top variant calling accuracy. |
Somatic SNV/INDEL Variant Calling | TNseq®: Matches MuTect, MuTect2 v3.8 - 4.0 without downsampling for higher accuracy and improved detections of low allelic fraction variants.TNscope®: Winner of ICGC-TCGA DREAM challenge. Improved accuracy, machine learning enhanced filtering. Supports molecular barcodes and unique molecular identifies. |
Structural Variant Calling | Germline and somatic SV calling, including translocations, inversions, duplications and large INDELs. |
Joint Calling | Supports large-cohort joint calling of over 200,000 WGS samples directly from gVCF and without intermediate steps. |
BCL-FASTQ Tool | Sentieon®'s external library accelerates BCL to FASTQ conversion by 1.5 - 2x. |
RNA Variant Calling | Matches GATK RNAseq variant calling Best Practices. |
使用方法
基因分析平台通过提供公共应用的方式大大简化了Sentieon软件的使用,并保留了软件所有的原生功能,同时支持用户使用Sentieon进行定制开发。用户只需要按照以下几种方式之一,即可使用Sentieon来分析基因数据或开发加速应用。
直接通过应用仓库安装Sentieon各分析流程:
用户也可选中某分析流程后点击进入,选择该流程的不同版本:
目前基因分析平台在各个区域提供"201911"、"202010.02"、"202112.05"、"202112.06"以及"202308"版本的Sentieon供用户使用。
自定义Sentieon流程:
用户也可参考公共应用中的Sentieon流程定制自己的Sentieon应用,仅需在WDL的runtime属性中通过software字段指定Sentieon版本即可,command中支持Sentieon的各种原生用法。
runtime {
software: "sentieon:202308"
}
如:
Sentieon详细功能介绍请查看Sentieon软件的命令和用法。