迭代(Map)

更新时间: 2024-10-24 10:00:30

迭代(Map)状态允许用户对一个数组中的每个元素执行相同的操作,从而简化大规模数据的处理和工作流的管理。

迭代状态的处理模式

为了提高数据处理的效率,适应不同的应用场景,迭代状态提供了以下两种处理模式:

  • 内联模式

    迭代(Map)状态的每次迭代都在包含迭代(Map)状态的工作流的上下文中运行。默认情况下,迭代(Map)状态是内联模式。更多信息,请参见内联模式

  • 分布式模式

    迭代(Map)状态将每次迭代作为子工作流执行,最高支持10000个Map迭代。更多信息,请参见分布式模式

内联模式和分布式模式的区别

对比项

内联模式

分布式模式

数据来源

从工作流上一步状态获取数据。

  • 从工作流上一步状态获取数据。

  • 获取对象存储OSS Bucket中的对象列表

  • 获取对象存储OSS Bucket中的CSV文件

  • 获取对象存储OSS Bucket中的Inventory

  • 获取对象存储OSS Bucket中的JSON文件

迭代过程

迭代(Map)状态的每次迭代都在包含迭代(Map)状态的工作流的上下文中运行。

迭代(Map)状态将每次迭代作为子工作流执行,最高支持10000个Map迭代。

迭代的最大并发数

默认最大并发数是40。

默认最大并发数是100,可通过工单提交配额提升申请。

迭代的最大次数

默认最大迭代次数没有限制,但迭代Output的总大小受到Event IO Size 的限制。

默认最大迭代次数 10000,可通过工单提升至最大1000000。

有效载荷

强制限制64 KB的输入有效负载大小。

通过ItemReader读取外部输入时不受64 KB的输入有效负载大小限制。

上一篇: 并行(Parallel) 下一篇: 内联模式
阿里云首页 云工作流 相关技术圈