本文介绍商品检测模型的详细信息,包括模型功能、输入格式、输出格式及测试数据。

  • 模型介绍

    该模型采用YoloV5结构,能够识别图像内的多个常见商品,并返回多个物体类别和位置信息。例如识别图像内的上衣、裙装、下装、箱包、鞋、配饰、零食、美妆、瓶饮、家具、玩具、内衣及数码。

  • 输入格式
    输入数据为JSON格式字符串,包含image字段,对应的value为图片内容的Base 64编码。
    {
      "image": "图像文件内容的Base 64编码"
    }
  • 输出格式
    输出数据为JSON格式字符串,包含的字段如下表所示。
    字段 描述 Shape Type
    detection_boxes 检测到的目标框[y1, x1, y2,x2],其坐标顺序为[top, left, bottom, right] [num_detections, 4] FLOAT
    detection_scores 目标检测概率。 num_detections FLOAT
    detection_classes 目标区域类别ID,即对detection_class_names取值数组中的元素从0开始编号。

    例如,detection_classes=[0, 4, 4, 2]表示目标区域分别检测到了上衣('top')、鞋('shoes')、鞋('shoes')及下装('bottom')。

    num_detections INT
    detection_class_names 目标区域类别名称,即识别到的物品类别。类别名称的取值数组为['top', 'dress', 'bottom', 'bags', 'shoes', 'accessories', 'snacks', 'beauty', 'drink', 'furniture', 'toys', 'underwear', '3c', 'clothes', 'others'],其中的元素依次表示上衣、裙装、下装、箱包、鞋、配饰、零食、美妆、瓶饮、家具、玩具、内衣、数码、服饰及其他。 num_detections STRING
    request_id 请求的唯一标识。 [] STRING
    success 请求是否成功。取值包括:
    • true:请求成功。
    • false:请求失败。
    [] BOOL
    error_code 请求失败时,返回的错误码。 [] INT
    error_msg 请求失败时,返回的错误信息。 [] STRING
    输出数据的示例如下。
    {
        "request_id": "701e10cc-8031-49d5-98e2-767fb91e****",
        "success": true,
        "detection_boxes": [[303.1582946777344, 116.68634033203125, 469.31536865234375, 323.48870849609375], [459.77313232421875, 687.7918701171875, 540.4406127929688, 798.2620239257812], [294.84521484375, 693.1432495117188, 389.1251220703125, 798.4052124023438], [304.1402893066406, 285.03729248046875, 487.53369140625, 434.85955810546875]],
        "detection_scores": [0.8764256834983826, 0.8597352504730225, 0.8521379232406616, 0.7506827712059021],
        "detection_classes": [0, 4, 4, 2],
        "detection_class_names": ["top", "shoes", "shoes", "bottom"]
    }