CPFS并行文件存储

CPFS并行文件存储提供高性能计算文件存储,支持标准的POSIXMPI-IO协议,自带的高性能计算程序无需任何接口适配和性能优化即可高效执行,满足高性能文件存储需求。

产品架构

CPFS并行文件存储是针对高性能和超大规模存储场景推出的文件存储产品,可结合云上、云下多级存储池,拥有全新的文件存储架构。

该产品单集群最大可扩展至16384个节点,提供高性能、高可扩展性、低时延的分布式文件存储服务。可适用于自动驾驶模型训练、基因组测序数据组装和石油勘探业务分析等场景。

cpfs

产品优势

优势

说明

混合云存储架构

集成公共云存储服务,为Cloud Bursting场景下的客户提供优质的体验。

高可扩展性

  • CPFS并行文件存储集群最大规模可扩展至16384个节点。

  • 完全对称式分布式架构,元数据和实体数据的吞吐带宽都可以得到线性伸缩。

  • 真正无缝扩容:扩容时自动检测现有存储节点负载,控制扩容速度。

  • 多级存储架构:支持云下CPFS并行文件存储扩容到云上CPFS、OSS存储。

高性能

  • 单集群CPFS并行文件存储最大可支持TB/s级吞吐量。

  • 支持100G Ethernet网络接入,提供单节点2.3 GB/s的吞吐量。

  • 支持100G/200G InfiniBand网络接入,吞吐时延得到系统性提升。

高可用、高可靠性

  • Rolling Update功能:提供滚动式升级,升级过程中服务不间断。

  • 秒级故障检测功能:可快速检测坏盘和宕机的服务节点。

  • 支持多种数据保障模式:

    • 多副本模式:2副本、3副本

    • 纠删码模式:(4+2p)、(4+3p)、(8+2p)、(8+3p)

丰富的接口协议

支持POSIX(SMB、NFS)、Object、HDFS等接口协议:

  • NFS v4.0、NFS v3

  • SMB 3.0、SMB 2.1、SMB 2

  • OpenStack Swift along with Keystone v3

  • S3

  • HDFS transparency 3.1.0-X、 3.0.0-X、2.7.3-X、2.7.2-X、2.7.0-X

适用场景

场景

场景介绍

自动驾驶模型训练

为自动驾驶场景中车载摄像头、雷达、红外等设备采集的大量的小文件,CPFS并行文件存储提供低时延,高IOPS的访问能力,模型训练速度可以提高3倍以上。

基因组测序数据组装

基因序列组装需要海量的并发计算作业,CPFS并行文件存储提供高达百GB的访问带宽,可以满足成百上千个节点同时访问的需求,破除文件IO访问瓶颈,任务完成时间缩短到原来的50%。

石油勘探业务分析

大量地质数据需要计算、处理和分析,并且原始地震资料和过程数据需要长期保存。CPFS并行文件存储提供PB级单一命名空间,支持空间配额灵活管理,资源划分给不同的计算任务,满足业务随时扩展的需要。

产品规格

详细产品规格,请参见以下链接: