关于人脸检测与五官定位、人体检测能力升级的公告_视觉智能开放平台(VIAPI)-阿里云帮助中心

尊敬的阿里云用户，为进一步提升用户体验和产品性价比，阿里云视觉智能开放平台将于2024年04月25日对人脸检测与五官定位（DetectFace）、人体检测（DetectPedestrian）两个能力进行迭代升级，为您提供更优的AI服务。本次能力迭代升级，对于历史用户是无感升级，不影响历史用户的调用。

调整时间

2024年04月25日

人脸检测与五官定位能力升级说明

人脸检测与五官定位能力迭代升级将新增出参LandmarkScore，该参数对于猫、狗等非人脸误检测的问题，通过增加透出关键点质量分分值参数，提供用户结合场景自行判定的过滤条件。

更新前

名称	类型	示例值	描述
RequestId	String	26B5334B-FD8A-5994-A1DA-3CA8F7B25676	请求ID。
Data	Object		返回的结果数据内容。
FaceProbabilityList	Array of Float	0.96	截图中包含人脸的概率，取值范围0~1。如有多个人脸，则依次返回。例如有两个人脸则返回[face_prob1, face_prob2]。图像中人脸区域分辨率越大，人脸越清晰，人脸正视，对应的该值越大。
Pupils	Array of double	[417.83, 226.09, 8.15, 517.46, 231.53, 8.15]	左右两个瞳孔的中心点坐标和半径，每个人脸6个浮点数，顺序为[left_iris_cenpt.x, left_iris_cenpt.y, left_iris_radius, right_iris_cenpt.x, right_iris_cenpt.y, right_iris_radis]。
FaceRectangles	Array of Integer	[358, 141, 207, 255]	返回人脸矩形框，分别是[left, top, width, height]。如有多个人脸，则依次顺延，返回矩形框。例如有两个人脸则返回[left1, top1, width1, height1, left2, top2, width2, height2]。 left-top: 表示以图片左上角为坐标原点，目标框所对应的左上角点位置（x,y），表示框的第一个点距离图片左边界x像素，距离上边界y个像素。 width-height：表示目标框的宽和高。目标框面积为width*height，目标框右下角坐标为（left+width,top+height）。
FaceCount	Integer	1	检测出的人脸个数。
PoseList	Array of Float	[5.02, -3.95, 2.41]	返回人脸姿态角度，格式为[yaw, pitch, roll]。如有多个人脸，则依次顺延。 yaw为左右角度，取值范围-90~90。 pitch为上下角度，取值范围-90~90。 roll为平面旋转角度，取值范围-180~180。
Landmarks	Array of Float	[381.1, 201.72, 448.09, 205.17, 415.19, 191.2, 415.28, 201.64, 391.35, 196.03, 403.15, 191.57, 426.94, 194.07, 438.42, 197.65, ......]	人脸特征点定位结果，每个人脸返回一组特征点位置，表示方式为（x0, y0, x1, y1, ……）；如有多个人脸，则依次顺延，返回定位浮点数。
LandmarkCount	Integer	105	人脸特征点数目，目前固定为105点。依次为：眉毛24点，眼睛32点，鼻子6点，嘴巴34点，外轮廓9点。
Qualities	Object		人脸质量情况，分数越高表示越有利于识别。
ScoreList	Array of Float	99.92	质量综合分数，分数越高越有利于识别，取值范围(0,100]。如有多张人脸，则依次返回。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片综合质量越高，小于85代表图片综合质量越低。
BlurList	Array of Float	99.21	人脸模糊度对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片模糊的概率越低，小于85代表图片模糊的概率越高。
FnfList	Array of Float	100	目标是否为人脸及其对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片是人脸的概率越高，小于85代表图片是人脸的概率越低。
GlassList	Array of Float	100	眼镜等上半脸遮挡对识别的影响分数，分数越高越有利于识别，取值范围为(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断是否设置阈值及相应阈值大小），大于85代表戴眼镜的概率越低，小于85代表戴眼镜的概率越高。
IlluList	Array of Float	100	光照对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片光照好的概率越高，小于85代表图片光照好的概率越低。
MaskList	Array of Float	99.53	口罩等下半脸遮挡对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表戴口罩概率越低，小于85代表戴口罩概率越高。
NoiseList	Array of Float	99.74	图片噪声对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片有噪声的概率越低，小于85代表图片有噪声的概率越高。
PoseList	Array of Float	100	姿态对识别的影响分数，分数越高越有利于识别，取值范围为(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表人脸姿态正面的概率越高，小于85代表人脸姿态正面的概率越低。

更新后

名称	类型	示例值	描述
RequestId	String	26B5334B-FD8A-5994-A1DA-3CA8F7B25676	请求ID。
Data	Object		返回的结果数据内容。
FaceProbabilityList	Array of Float	0.96	截图中包含人脸的概率，取值范围0~1。如有多个人脸，则依次返回。例如有两个人脸则返回[face_prob1, face_prob2]。图像中人脸区域分辨率越大，人脸越清晰，人脸正视，对应的该值越大。
Pupils	Array of double	[417.83, 226.09, 8.15, 517.46, 231.53, 8.15]	左右两个瞳孔的中心点坐标和半径，每个人脸6个浮点数，顺序为[left_iris_cenpt.x, left_iris_cenpt.y, left_iris_radius, right_iris_cenpt.x, right_iris_cenpt.y, right_iris_radis]。
FaceRectangles	Array of Integer	[358, 141, 207, 255]	返回人脸矩形框，分别是[left, top, width, height]。如有多个人脸，则依次顺延，返回矩形框。例如有两个人脸则返回[left1, top1, width1, height1, left2, top2, width2, height2]。 left-top: 表示以图片左上角为坐标原点，目标框所对应的左上角点位置（x,y），表示框的第一个点距离图片左边界x像素，距离上边界y个像素。 width-height：表示目标框的宽和高。目标框面积为width*height，目标框右下角坐标为（left+width,top+height）。
FaceCount	Integer	1	检测出的人脸个数。
PoseList	Array of Float	[5.02, -3.95, 2.41]	返回人脸姿态角度，格式为[yaw, pitch, roll]。如有多个人脸，则依次顺延。 yaw为左右角度，取值范围-90~90。 pitch为上下角度，取值范围-90~90。 roll为平面旋转角度，取值范围-180~180。
Landmarks	Array of Float	[381.1, 201.72, 448.09, 205.17, 415.19, 191.2, 415.28, 201.64, 391.35, 196.03, 403.15, 191.57, 426.94, 194.07, 438.42, 197.65, ......]	人脸特征点定位结果，每个人脸返回一组特征点位置，表示方式为（x0, y0, x1, y1, ……）；如有多个人脸，则依次顺延，返回定位浮点数。
LandmarkScore	Array of Float	86.89	检测关键点综合分值，取值范围(0,100]，推荐85的阈值，分值越大，质量越高。
LandmarkCount	Integer	105	人脸特征点数目，目前固定为105点。依次为：眉毛24点，眼睛32点，鼻子6点，嘴巴34点，外轮廓9点。
Qualities	Object		人脸质量情况，分数越高表示越有利于识别。
ScoreList	Array of Float	99.92	质量综合分数，分数越高越有利于识别，取值范围(0,100]。如有多张人脸，则依次返回。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片综合质量越高，小于85代表图片综合质量越低。
BlurList	Array of Float	99.21	人脸模糊度对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片模糊的概率越低，小于85代表图片模糊的概率越高。
FnfList	Array of Float	100	目标是否为人脸及其对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片是人脸的概率越高，小于85代表图片是人脸的概率越低。
GlassList	Array of Float	100	眼镜等上半脸遮挡对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表戴眼镜的概率越低，小于85代表戴眼镜的概率越高。
IlluList	Array of Float	100	光照对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片光照好的概率越高，小于85代表图片光照好的概率越低。
MaskList	Array of Float	99.53	口罩等下半脸遮挡对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表戴口罩概率越低，小于85代表戴口罩概率越高。
NoiseList	Array of Float	99.74	图片噪声对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断设置阈值与否及相应阈值大小），大于85代表图片有噪声的概率越低，小于85代表图片有噪声的概率越高。
PoseList	Array of Float	100	姿态对识别的影响分数，分数越高越有利于识别，取值范围(0,100]。如有多个人脸，则依次顺延。在识别时，推荐设置阈值大于等于85（您可以按实际应用场景判断是否设置阈值及相应阈值大小），大于85代表人脸姿态正面的概率越高，小于85代表人脸姿态正面的概率越低。

人体检测能力升级说明

能力迭代升级，主要是对算法模型的优化，提供更优的AI服务，对历史调用人体检测能力的用户不产生影响。

感谢您长期以来对视觉智能开放平台的支持，如果您对以上服务使用有疑问，欢迎随时联系您的商务经理进行咨询，或通过钉钉群（23109592）加入阿里云视觉智能开放平台咨询群联系我们。