本文介绍基因分析平台中基因数据文件的使用方法,包括上传、下载、删除等操作。
基因分析平台并不直接提供基因数据的存储功能,而是依赖于阿里云对象存储OSS来帮助用户管理自己的基因数据文件。在开通基因分析平台时,由用户授权给基因分析平台访问用户OSS的角色权限,平台的运行任务从用户OSS中获得计算输入,最终计算结果也写回用户的OSS中。
基因分析平台工作空间内数据管理页面,内嵌了OSS功能,帮助用户上传/下载/删除基因数据文件,这些与用户直接在OSS控制台中操作完全等同。
工作空间中数据管理的文件页面,默认展示的是工作空间绑定的OSS存储桶中的数据文件。用户也可以下拉切换访问该区域内任意有权限的OSS存储桶。
管理工具
用户可以使用所有对象存储OSS常用工具汇总,来管理基因数据文件,支持网页、图形客户端、命令行工具等多种途径。
在上传文件弹窗页面中,平台提供了与该工作空间关联的OSS存储桶名称和所在区域。根据这些信息,用户就可以进行相应的上传、下载、删除操作。
本地基因数据上传/下载
用户本地数据可以使用上述工具上传到基因分析平台工作空间中,计算分析结果按照同样的方式下载到本地。不同工具的选择建议如下:
网页上传文件单个大小不能超过5G,且需保持打开网页,中断后无法恢复,适用于直接上传小文件。
OSSBrowser客户端提供图形操作界面,无大小限制,支持并行上传和中断恢复,适用于用户个人电脑上传基因数据文件,方便简单。
OSSUtils命令行工具,无大小限制,支持并行上传和中断恢复,适用于用户本地服务器或者HPC集群上传基因数据文件,并且可以通过编写脚本的方式,实现自动化上传。
离线迁移(闪电立方),单次TB到PB级别的本地数据迁移上云,适用于本地机房带宽较小或无公网,历史大批量数据的搬迁。
基因数据上传到OSS中无需付费,但存储和下载需要收取相应的费用,具体请查看对象存储OSS的计费概述。
其他来源数据处理方式
阿里云其他用户账号数据
如果用户的基因数据来源与其他阿里云用户,如测序服务商。可由对方通过阿里云访问控制(RAM)授权你访问存储数据的bucket(见常见问题中“基因分析平台能否跨账号访问OSS资源”),然后基因分析平台即可使用。
其他公有云厂商数据
如果用户的基因数据存储在其他公有云厂商中,可以通过阿里云的在线迁移服务,导入到基因分析平台的工作空间中,即可使用。