本文通过实际案例,展示了如何使用实体表格和应用模板,来批量投递的10个样本的分析运行任务。
假设用户有10个全基因组测序的样本数据需要分析,我们通过以下步骤详细介绍如何通过基因分析平台来“一键”高效简便的完成所有工作。
创建工作空间,获取分析应用
创建batch-submit-demo工作空间,如已有可用工作空间也可忽略该步骤。
在应用仓库中安装sentioen/dnaseq到该工作空间中。安装成功后,跳转到对应工作空间的应用列表。
上传基因数据文件
使用命令行工具ossutil64,将本地文件上传到工作空间对应的OSS Bucket中。
root@demo:~/batch-submit-demo# tree reads/
reads/
├── S001_R1.fastq.gz
├── S001_R2.fastq.gz
├── S002_R1.fastq.gz
├── S002_R2.fastq.gz
├── S003_R1.fastq.gz
├── S003_R2.fastq.gz
├── S004_R1.fastq.gz
├── S004_R2.fastq.gz
├── S005_R1.fastq.gz
├── S005_R2.fastq.gz
├── S006_R1.fastq.gz
├── S006_R2.fastq.gz
├── S007_R1.fastq.gz
├── S007_R2.fastq.gz
├── S008_R1.fastq.gz
├── S008_R2.fastq.gz
├── S009_R1.fastq.gz
├── S009_R2.fastq.gz
├── S010_R1.fastq.gz
└── S010_R2.fastq.gz
使用ossutil64将本地reads文件上传到基因分析平台中。
root@demo:~/batch-submit-demo#
~/ossutil64 cp -e oss-cn-beijing.aliyuncs.com -r reads/ oss://gstor-batch-submit-demo-cn-beijing-464e1579/reads/
上传完成后,在工作空间中可以浏览文件。
定义实体表格,并添加数据
按照演示的目的,我们定义了dnaseq分析应用输入所需要的样本属性。
name:应用的名字
reads_group: 测序数据所属的reads group
FASTQ1:样本测序数据的read_1
FASTQ2: 样本测序数据的read_2
在“工作空间 -表格”中添加sample的实体类型。
下载“sample.csv”模板后,在本地使用Excel进行编辑,将每个样本实际对应的信息和测序文件OSS地址编辑保存。
上传sample.csv文件到空间工作的表格中。
查看sample实体表格数据。
创建应用运行模板
在应用页面中选择dnaseq应用来创建分析模板。点击右侧“更多”,选择创建模板:
选择sample作为模板的根实体类型。
对于dnaseq应用分析的必须参数,通过实体表达式和固定值来填充,确保满足运行条件。
同时可以直接在输出中定义新的表格列,来保存运行任务完成后的分析结果。
提交后即可获得为指定应用设计好的运行模板。
批量投递10个样本的分析运行任务
点击“启动”模板,只需要选择需要分析的样本(sample)即可投递任务,无需再指定其他运行参数。
通过投递ID管理所有运行任务
投递完成后,即可生产投递记录。通过暂定和恢复投递记录,即可批量管理该投递解析生成的所有运行任务。
完成基因数据分析任务,查看结果
运行任务的结果会被写回表格中,可以通过查看或下载表格,获得这一批样本的分析结果。