多元索引限制

本文介绍了创建多元索引时的Mapping限制,使用Search接口和ParallelScan接口查询数据时的限制,多元索引速率、总大小、行数等限制以及多元索引的支持地域。

Mapping

创建多元索引时对字段长度、字段数量、字段类型映射、嵌套类型、表中字段等的使用限制。具体说明请参见下表。

名称

最大值

说明

多元索引字段数量

1000

可被索引的字段数。

数组长度

256

数组中最多包含的元素个数。

Nested嵌套层数

5

最多支持5Nested嵌套。

Nested字段的子行数量

256

嵌套字段的嵌套行最大数量,非子字段数量。

Nested字段数量

100

嵌套中子字段的个数。

表主键列长度之和

1000字节

所有主键列的长度累加后不超过1000字节。

表主键列中String长度

1000字节

String类型的主键列要建立索引时,列值长度不能超过1000字节。

表属性列中String长度(索引成Keyword)

4 KB

无。

表属性列中String长度(索引成Text)

2 MB

一般情况下,与数据表中属性列的长度限制相同。当对索引成Text类型的字段使用模糊分词方式进行模糊查询时,原文内容会限制最大1024字符或者汉字,超过后会截断,只保留前1024个字符或者汉字。

通配符查询的Query长度

32

不超过32字符。

前缀查询的Query长度

1000字节

不超过1000字节。

向量字段类型的个数

1

一个多元索引中最多创建1个向量字段类型。如果业务需求超过限制,请提交工单联系我们。

向量字段类型支持的最大维度 (Dimension)

2048

向量维度最大值。

向量检索KnnVectorQuery返回最相似的前TopK文档数

1000

最多返回前1000文档数。

Search

使用Search接口查询数据以及使用Search接口统计和分析数据时的使用限制。具体说明请参见下表。

类别

名称

最大值

说明

通用限制

offset+limit

50000

如果业务需求超过限制,请使用next_token。

limit

100

默认值为10,最大值为100。

  • 当使用Search接口查询指定列的数据时,如果多元索引中包含了查询列的数据时,limit参数最大支持到1000,即一个请求最多返回1000条结果。

  • 如果业务需求超过限制,请提交工单联系我们。

timeout

10s

无。

CU

无限制

无。

QPS

10

  • 针对于轻量的事务型查询(TP),QPS上限为10万。

  • 如果业务需求超过限制,请提交工单联系我们。

一次Search查询中的Query个数

1024

如果Search查询中的Query嵌套太复杂,则会影响查询效率,请注意精简Query。

多词精确查询的查询关键词数量

1024

最多支持设置1024个查询关键词。

全文检索

高亮分片总个数

500

所有inner_hitshighlight内最多支持请求返回的高亮分片总个数。

高亮字段数量

10

数据查询时,最多支持为10个字段指定高亮参数。

统计聚合

同层Aggregation个数

5

SubGroupBy中添加Aggregation重新从0计算。

同层GroupBy个数

5

SubGroupBy中添加GroupBy重新从0计算。

GroupBy嵌套层数

3

层数计算包含本身的GroupBy。

GroupByFilter中的Filter个数

10

无。

GroupByField返回的分组个数

2000

无。

GroupByComposite内部sources数量个数

32

多列字段分组支持的最大列数限制。

GroupByRange中的Range个数

100

无。

GroupByGeodistance中的Range个数

10

无。

ParallelScan

使用ParallelScan接口查询数据以及并发导出数据时的使用限制。具体说明请参见下表。

类别

名称

说明

通用限制

offset+limit

无法指定offset+limit,只能从最开始往后面遍历。

limit

最大值为2000。

CU

无限制。

QPS

无限制。

最大并发

ComputeSplits的返回值中的MaxParallel值。

任务有效时间

任务有效时间(aliveTime)的最大值为10分钟。

任务数限制

同时存在的ParallelScan任务数不能超过10个。同一个sessionIdScanQuery相同的多个并发任务视为一个任务。更多信息,请参见并发导出数据

Index

多元索引的速率、同步延迟、行数和总大小的使用限制。具体说明请参见下表。

名称

最大值

说明

速率

5万行/s

  • 初始写入或瞬间写入时会有分钟级别负载均衡时间。

  • 文本类型的由于涉及分词会有较高CPU消耗,限制为1万行/s。

  • 如果业务需求超过限制,请提交工单联系我们。

同步延迟

3s

  • 99%情况下在3秒内。

  • 新建索引最多会有1分钟的初始化时间。

行数

1000亿

如果业务需求超过限制,请提交工单联系我们。

总大小

100 TB

如果业务需求超过限制,请提交工单联系我们。

其他限制

目前多元索引功能开放的地域包括华东1(杭州)、华东1 金融云、华东2(上海)、华东2 金融云、华北1(青岛)、华北2(北京)、华北2 阿里政务云1、华北3(张家口)、华北6(乌兰察布)、华南1(深圳)、华南3(广州)、西南1(成都)、中国香港、日本(东京)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、菲律宾(马尼拉)、泰国(曼谷)、德国(法兰克福)、英国(伦敦)、美国(硅谷)、美国(弗吉尼亚)。其中美国(硅谷)地域暂不支持向量检索功能。

说明

如果上述限制项不能满足您的业务需求,请在阿里云官网申请更高需求。在工单中请说明场景、限制项名称、限制项的数量需求、申请需求的原因,在后续功能开发中会优先考虑您的需求。