本文主要介绍QPS相关信息。
使用阿里云视觉智能开放平台服务时,大部分能力都会限制QPS,具体的QPS限制和每个能力的付费方式有关,您可以在视觉智能开放平台控制台查看每个能力的QPS阈值。更多有关QPS的常见问题,请参见计费定价类。
什么是QPS
QPS(Query Per Second)是指,每秒钟请求或任务的数量,即QPS=并发数/平均响应时间。其中并发数是指,系统同时处理的请求或任务的数量。例如,人脸检测1:1能力平均响应时间为500ms,您拥有4个并发,则需要购买的QPS为4/0.5=8。如果您不想启动全部的并发,可根据实际业务需求套用公式。
QPS限制提升流程和处理
视觉智能开放平台能力在开通后都有QPS限制,当调用频率超出QPS限制,会触发限流,导致调用报错。
如果您只是开通了能力,默认QPS限制不超过2(其中文字识别类目下的能力默认QPS限制不超过1,人脸人体类目下的指纹提取在审核通过后,开通能力后必须先购买QPS才能调用),具体限制请参考相应能力的按量付费计费介绍中的QPS限制。
如果您希望提升QPS限制,对于支持资源包的能力,您可以购买资源包,购买后会在次日早上8点提升QPS限制,一般能够提升到5QPS,详情可以查看相应能力资源包购买后的QPS调整策略。
如果您想进一步调整QPS限制,对于支持购买QPS预付费的能力,您可以在线购买QPS预付费,分割抠图最高可直接购买到30QPS,人脸人体最高可直接购买到50QPS,如需购买更多QPS,请通过钉钉群:23109592,联系我们。
您可以在视觉智能开放平台控制台找到对应能力后,单击资源包下方的购买,或者QPS下方的扩容进行购买。
对于无法通过以上方案提升QPS限制的能力,或者上述方案提升后还无法满足您的业务需求,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们,将有技术人员与您对接QPS提升需求。
计费方式与QPS
如果您只开通服务,默认为按量付费方式,即按照您的调用次数或者其他维度进行计费,同时,按量付费有QPS限制,更多计费规则和QPS限制说明,请参见具体能力对应的按量付费计费介绍。
如果您购买了资源包,可以查看相应能力资源包购买后的QPS调整策略。
购买资源包后,调用会优先抵扣资源包,而不是按量付费。QPS调整并不是立即生效,会有一定延时,一般是次日8点后生效,更多信息请参见相应能力的资源包计费介绍。
购买资源包只是提高了QPS限制,调用还是需要抵扣资源包点数,如果资源包点数抵扣完毕,会自动转换为按量付费模式,相应的QPS限制也会调整为按量付费模式的QPS限制。资源包点数剩余20%余量及耗尽时,系统会以短信的方式推送预警通知。
部分能力支持直接购买预付费QPS,如果您直接购买预付费QPS,QPS限制将立即生效,同时在享有预付费QPS时间段内,调用是不额外收费的。当预付费QPS到期后,调用将变更为资源包付费(如果您购买了相应能力的资源包)或者按量付费。
如果您同时购买了资源包或预付费QPS,扣费顺序为:预付费QPS>预付费资源包>按量付费。
例如,您想使用人脸比对1:1(CompareFace)功能,2023年2月18号开通了人脸人体类目能力,2023年2月20号购买了图像通用资源包,2023年2月22号购买了10QPS的人脸比对1:1预付费QPS,购买了2天时间,您的QPS限制规则如下:
时间 | QPS | 说明 |
2023年2月18号~2023年2月21号8点 | 2 | 按照开通服务后按量付费的规则计算。 |
2023年2月21号8点~2023年2月22号 | 5 | 您购买资源包后,次日8点QPS限制生效。 |
2023年2月22号~2023年2月24号 | 10 | 您购买预付费QPS后,QPS限制立即生效,有效期为2天。 |
2023年2月25号~资源包耗尽或者过期 | 5 | 预付费QPS到期,自动变更为资源包对应的QPS。 |
资源包耗尽或者过期以后 | 2 | 资源包耗尽或者过期,自动变更为按量付费对应的QPS。 |
QPS限制逻辑
QPS(query per second)是每秒钟调用次数,如果超出QPS,那么超出的部分将会在调用的时候返回限流错误,错误类似:
{
"RequestId": "15C865AD-8C45-512F-B4E5-8963DB190181",
"HostId": "facebody.cn-shanghai.aliyuncs.com",
"Code": "Throttling",
"Message": "调用被限流,请稍后再调用,或者购买QPS提升调用限制",
"Recommend": "https://next.api.aliyun.com/troubleshoot?q=Throttling&product=facebody"
}
例如,您通过计费规则或者查看控制台得知某能力的QPS为2,而在一秒内调用了3次,那么前2次将调用成功,第3次会被限流且返回以上错误信息,同时第3次调用不计费(视觉智能开放平台所有能力只有调用成功才会计费)。QPS仅限制一秒内的调用次数,不会累加上一秒调用次数。例如,如果下一秒内又调用2次,那么这2次都将调用成功。