视觉模型训练插件支持视觉领域常用模型的标注、训练及发布,并针对移动端场景进行了模型深度优化,您可以通过手机扫码快速体验模型效果,也可以将模型部署在移动设备上。本文介绍使用视觉模型训练插件进行目标检测的详细流程。
前提条件
- 已完成OSS授权,详情请参见OSS授权。
- 已创建目标检测实例,详情请参见创建实例。
- 已将训练图像上传至OSS,且满足OCR识别的数据集要求和规范,详情请参见使用限制。 建议使用图形化管理工具ossbrowser批量上传图片数据,详情请参见快速使用ossbrowser。
背景信息
测试数据:下载目标检测Demo数据。
使用限制
用于目标检测的图像需要满足以下数据集要求和规范:
- 数据集要求
- 图像质量:无损坏图像,且图像分辨率高于30像素。系统支持JPG及JPEG格式。
- 数据均衡:建议训练数据集每类检测目标图像均大于50张,且不同种类的数据保持均衡。
- 泛化能力:选择实际场景的多角度样本进行训练。
- 数据集规范
存储在OSS中的训练图片必须满足上述格式要求。其中your_image_dir表示存储所有训练图片的文件夹。标注结果存储为XML文件,满足PASCAL(Pattern Analysis,Statistical Modelling and Computational Learning)VOC(Visual Object Classes)XML标注格式。|-- your_image_dir / | -- a.jpg | -- a.xml | -- b.png | -- b.xml | -- c.png ...
XML标注格式的示例如下。
该示例标注了两个Object:dog和cat。<?xml version="1.0" encoding="utf-8"?> <annotation> <size> <width>1280</width> <height>720</height> <depth>3</depth> </size> <object> <name>dog</name> <bndbox> <xmin>549</xmin> <xmax>715</xmax> <ymin>257</ymin> <ymax>289</ymax> </bndbox> <truncated>0</truncated> <difficult>0</difficult> </object> <object> <name>cat</name> <bndbox> <xmin>842</xmin> <xmax>1009</xmax> <ymin>138</ymin> <ymax>171</ymax> </bndbox> <truncated>0</truncated> <difficult>0</difficult> </object> <segmented>0</segmented> </annotation>
操作流程
使用视觉模型训练插件进行目标检测的流程如下:
- 创建数据集
创建用于目标检测的训练数据集。
- 步骤二:标注数据
如果有未标注的数据,可以在线标注。
- 步骤三:创建任务
创建模型训练任务。
- 步骤四:查看训练详情
训练过程中,您可以查看节点训练进度、节点详情信息及训练日志。
- 步骤五:客户端预览模型
您可以通过手机支付宝扫描二维码。快速体验模型效果。
- 步骤六:服务端部署
视觉模型训练插件与PAI-EAS高效对接,您可以一键将模型部署为RESTful服务。
步骤一:创建数据集
步骤二:标注数据
如果数据集中有尚未标注的图像,可以在线标注。
- 在数据准备配置向导页面的数据集列表区域,单击操作列下的标注。
- 在标注页面,对每张图像进行标注,并单击提交。
- 单击预览,查看标注结果。