利用实体批量投递运行任务

本文通过实际案例,展示了如何使用实体表格和应用模板,来批量投递的10个样本的分析运行任务。

假设用户有10个全基因组测序的样本数据需要分析,我们通过以下步骤详细介绍如何通过基因分析平台来“一键”高效简便的完成所有工作。

创建工作空间,获取分析应用

创建batch-submit-demo工作空间,如已有可用工作空间也可忽略该步骤。

image.png

在应用仓库中安装sentioen/dnaseq到该工作空间中。安装成功后,跳转到对应工作空间的应用列表。

aaa

上传基因数据文件

使用命令行工具ossutil64,将本地文件上传到工作空间对应的OSS Bucket中。

11

root@demo:~/batch-submit-demo# tree reads/
reads/
├── S001_R1.fastq.gz
├── S001_R2.fastq.gz
├── S002_R1.fastq.gz
├── S002_R2.fastq.gz
├── S003_R1.fastq.gz
├── S003_R2.fastq.gz
├── S004_R1.fastq.gz
├── S004_R2.fastq.gz
├── S005_R1.fastq.gz
├── S005_R2.fastq.gz
├── S006_R1.fastq.gz
├── S006_R2.fastq.gz
├── S007_R1.fastq.gz
├── S007_R2.fastq.gz
├── S008_R1.fastq.gz
├── S008_R2.fastq.gz
├── S009_R1.fastq.gz
├── S009_R2.fastq.gz
├── S010_R1.fastq.gz
└── S010_R2.fastq.gz

使用ossutil64将本地reads文件上传到基因分析平台中。

root@demo:~/batch-submit-demo# 
~/ossutil64 cp -e oss-cn-beijing.aliyuncs.com -r reads/ oss://gstor-batch-submit-demo-cn-beijing-464e1579/reads/

上传完成后,在工作空间中可以浏览文件。

222

定义实体表格,并添加数据

按照演示的目的,我们定义了dnaseq分析应用输入所需要的样本属性。

  • name:应用的名字

  • reads_group: 测序数据所属的reads group

  • FASTQ1:样本测序数据的read_1

  • FASTQ2: 样本测序数据的read_2

在“工作空间 -表格”中添加sample的实体类型。

1

下载“sample.csv”模板后,在本地使用Excel进行编辑,将每个样本实际对应的信息和测序文件OSS地址编辑保存。

3

上传sample.csv文件到空间工作的表格中。

上传csv文件

查看sample实体表格数据。

2

创建应用运行模板

在应用页面中选择dnaseq应用来创建分析模板。点击右侧“更多”,选择创建模板:

image.png

选择sample作为模板的根实体类型。

23121312

对于dnaseq应用分析的必须参数,通过实体表达式和固定值来填充,确保满足运行条件。

image.png

同时可以直接在输出中定义新的表格列,来保存运行任务完成后的分析结果。

image.png

提交后即可获得为指定应用设计好的运行模板。

image.png

批量投递10个样本的分析运行任务

点击“启动”模板,只需要选择需要分析的样本(sample)即可投递任务,无需再指定其他运行参数。

image.png

通过投递ID管理所有运行任务

投递完成后,即可生产投递记录。通过暂定和恢复投递记录,即可批量管理该投递解析生成的所有运行任务。

完成基因数据分析任务,查看结果

运行任务的结果会被写回表格中,可以通过查看或下载表格,获得这一批样本的分析结果。