关于人脸检测与五官定位、人体检测能力升级的公告

尊敬的阿里云用户,为进一步提升用户体验和产品性价比,阿里云视觉智能开放平台将于2024年04月25日人脸检测与五官定位(DetectFace)、人体检测(DetectPedestrian)两个能力进行迭代升级,为您提供更优的AI服务。本次能力迭代升级,对于历史用户是无感升级,不影响历史用户的调用。

调整时间

2024年04月25日

人脸检测与五官定位能力升级说明

人脸检测与五官定位能力迭代升级将新增出参LandmarkScore,该参数对于猫、狗等非人脸误检测的问题,通过增加透出关键点质量分分值参数,提供用户结合场景自行判定的过滤条件。

更新前

名称

类型

示例值

描述

RequestId

String

26B5334B-FD8A-5994-A1DA-3CA8F7B25676

请求ID。

Data

Object

返回的结果数据内容。

FaceProbabilityList

Array of Float

0.96

截图中包含人脸的概率,取值范围0~1。如有多个人脸,则依次返回。例如有两个人脸则返回[face_prob1, face_prob2]。图像中人脸区域分辨率越大,人脸越清晰,人脸正视,对应的该值越大。

Pupils

Array of double

[417.83, 226.09, 8.15, 517.46, 231.53, 8.15]

左右两个瞳孔的中心点坐标和半径,每个人脸6个浮点数,顺序为[left_iris_cenpt.x, left_iris_cenpt.y, left_iris_radius, right_iris_cenpt.x, right_iris_cenpt.y, right_iris_radis]。

FaceRectangles

Array of Integer

[358, 141, 207, 255]

返回人脸矩形框,分别是[left, top, width, height]。如有多个人脸,则依次顺延,返回矩形框。例如有两个人脸则返回[left1, top1, width1, height1, left2, top2, width2, height2]。

left-top: 表示以图片左上角为坐标原点,目标框所对应的左上角点位置(x,y),表示框的第一个点距离图片左边界x像素,距离上边界y个像素。

width-height:表示目标框的宽和高。

目标框面积为width*height,目标框右下角坐标为(left+width,top+height)。

FaceCount

Integer

1

检测出的人脸个数。

PoseList

Array of Float

[5.02, -3.95, 2.41]

返回人脸姿态角度,格式为[yaw, pitch, roll]。如有多个人脸,则依次顺延。

  • yaw为左右角度,取值范围-90~90。

  • pitch为上下角度,取值范围-90~90。

  • roll为平面旋转角度,取值范围-180~180。

Landmarks

Array of Float

[381.1, 201.72, 448.09, 205.17, 415.19, 191.2, 415.28, 201.64, 391.35, 196.03, 403.15, 191.57, 426.94, 194.07, 438.42, 197.65, ......]

人脸特征点定位结果,每个人脸返回一组特征点位置,表示方式为(x0, y0, x1, y1, ……);如有多个人脸,则依次顺延,返回定位浮点数。

LandmarkCount

Integer

105

人脸特征点数目,目前固定为105点。依次为:眉毛24点,眼睛32点,鼻子6点,嘴巴34点,外轮廓9点。

Qualities

Object

人脸质量情况,分数越高表示越有利于识别。

ScoreList

Array of Float

99.92

质量综合分数,分数越高越有利于识别,取值范围(0,100]。如有多张人脸,则依次返回。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片综合质量越高,小于85代表图片综合质量越低。

BlurList

Array of Float

99.21

人脸模糊度对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片模糊的概率越低,小于85代表图片模糊的概率越高。

FnfList

Array of Float

100

目标是否为人脸及其对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片是人脸的概率越高,小于85代表图片是人脸的概率越低。

GlassList

Array of Float

100

眼镜等上半脸遮挡对识别的影响分数,分数越高越有利于识别,取值范围为(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断是否设置阈值及相应阈值大小),大于85代表戴眼镜的概率越低,小于85代表戴眼镜的概率越高。

IlluList

Array of Float

100

光照对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片光照好的概率越高,小于85代表图片光照好的概率越低。

MaskList

Array of Float

99.53

口罩等下半脸遮挡对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表戴口罩概率越低,小于85代表戴口罩概率越高。

NoiseList

Array of Float

99.74

图片噪声对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片有噪声的概率越低,小于85代表图片有噪声的概率越高。

PoseList

Array of Float

100

姿态对识别的影响分数,分数越高越有利于识别,取值范围为(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表人脸姿态正面的概率越高,小于85代表人脸姿态正面的概率越低。

更新后

名称

类型

示例值

描述

RequestId

String

26B5334B-FD8A-5994-A1DA-3CA8F7B25676

请求ID。

Data

Object

返回的结果数据内容。

FaceProbabilityList

Array of Float

0.96

截图中包含人脸的概率,取值范围0~1。如有多个人脸,则依次返回。例如有两个人脸则返回[face_prob1, face_prob2]。图像中人脸区域分辨率越大,人脸越清晰,人脸正视,对应的该值越大。

Pupils

Array of double

[417.83, 226.09, 8.15, 517.46, 231.53, 8.15]

左右两个瞳孔的中心点坐标和半径,每个人脸6个浮点数,顺序为[left_iris_cenpt.x, left_iris_cenpt.y, left_iris_radius, right_iris_cenpt.x, right_iris_cenpt.y, right_iris_radis]。

FaceRectangles

Array of Integer

[358, 141, 207, 255]

返回人脸矩形框,分别是[left, top, width, height]。如有多个人脸,则依次顺延,返回矩形框。例如有两个人脸则返回[left1, top1, width1, height1, left2, top2, width2, height2]。

left-top: 表示以图片左上角为坐标原点,目标框所对应的左上角点位置(x,y),表示框的第一个点距离图片左边界x像素,距离上边界y个像素。

width-height:表示目标框的宽和高。

目标框面积为width*height,目标框右下角坐标为(left+width,top+height)。

FaceCount

Integer

1

检测出的人脸个数。

PoseList

Array of Float

[5.02, -3.95, 2.41]

返回人脸姿态角度,格式为[yaw, pitch, roll]。如有多个人脸,则依次顺延。

  • yaw为左右角度,取值范围-90~90。

  • pitch为上下角度,取值范围-90~90。

  • roll为平面旋转角度,取值范围-180~180。

Landmarks

Array of Float

[381.1, 201.72, 448.09, 205.17, 415.19, 191.2, 415.28, 201.64, 391.35, 196.03, 403.15, 191.57, 426.94, 194.07, 438.42, 197.65, ......]

人脸特征点定位结果,每个人脸返回一组特征点位置,表示方式为(x0, y0, x1, y1, ……);如有多个人脸,则依次顺延,返回定位浮点数。

LandmarkScore

Array of Float

86.89

检测关键点综合分值,取值范围(0,100],推荐85的阈值,分值越大,质量越高。

LandmarkCount

Integer

105

人脸特征点数目,目前固定为105点。依次为:眉毛24点,眼睛32点,鼻子6点,嘴巴34点,外轮廓9点。

Qualities

Object

人脸质量情况,分数越高表示越有利于识别。

ScoreList

Array of Float

99.92

质量综合分数,分数越高越有利于识别,取值范围(0,100]。如有多张人脸,则依次返回。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片综合质量越高,小于85代表图片综合质量越低。

BlurList

Array of Float

99.21

人脸模糊度对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片模糊的概率越低,小于85代表图片模糊的概率越高。

FnfList

Array of Float

100

目标是否为人脸及其对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片是人脸的概率越高,小于85代表图片是人脸的概率越低。

GlassList

Array of Float

100

眼镜等上半脸遮挡对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表戴眼镜的概率越低,小于85代表戴眼镜的概率越高。

IlluList

Array of Float

100

光照对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片光照好的概率越高,小于85代表图片光照好的概率越低。

MaskList

Array of Float

99.53

口罩等下半脸遮挡对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表戴口罩概率越低,小于85代表戴口罩概率越高。

NoiseList

Array of Float

99.74

图片噪声对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断设置阈值与否及相应阈值大小),大于85代表图片有噪声的概率越低,小于85代表图片有噪声的概率越高。

PoseList

Array of Float

100

姿态对识别的影响分数,分数越高越有利于识别,取值范围(0,100]。如有多个人脸,则依次顺延。在识别时,推荐设置阈值大于等于85(您可以按实际应用场景判断是否设置阈值及相应阈值大小),大于85代表人脸姿态正面的概率越高,小于85代表人脸姿态正面的概率越低。

人体检测能力升级说明

能力迭代升级,主要是对算法模型的优化,提供更优的AI服务,对历史调用人体检测能力的用户不产生影响。

感谢您长期以来对视觉智能开放平台的支持,如果您对以上服务使用有疑问,欢迎随时联系您的商务经理进行咨询,或通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。