自学习平台的自定义KV模板功能有什么_文档智能(Document Mind)-阿里云帮助中心

本文介绍自定义KV模板的功能简介、功能优势、应用场景和操作指南等。

功能简介

自定义KV模板是针对卡证、票据等固定版式的数据提供的一款定制化产品。用户仅需通过一张模板数据的可视化拖拉拽配置，无需进行数据标注和模型训练，即可实现相同版式数据的自定义结构化识别抽取。经过配置调优的模板识别准确率可达85%以上，同时工具箱中还提供了分类器管理工具与字段类型管理工具，支持用户通过同一接口完成不同版式数据的自动分类路由与高精度识别。

功能优势

低成本：仅需提供一张样图即可完成模板搭建，无需标注。
低门槛：通过拖拉拽可视化配置即可完成模板定义，无需二次开发。
高效率：3-5分钟即可完成一个模板的配置。

应用场景

少样本冷启动：适用于业务数据样本少（少于20张）、需要快速上线验证的场景。
数据版式固定：适用于业务数据类型多，但每一种类型数据字段明确可标识，并且Key-Value位置固定的场景。广泛应用于学生证、结婚证、银行转账单等资质审核、财务报销、业务数据等结构化场景。

操作指南

如下所示为自定义KV模板操作演示参考：

自定义KV模板

创建自定义KV模板的流程如下图所示，仅需四步操作即可完成创建。

步骤一 : 上传模板图片

单击进入OCR文档自学习平台，找到自定义KV模板并单击立即开通。
开通成功后页面自动跳转至OCR文档自学习平台，找到自定义KV模板并单击创建任务，在创建应用页面根据您的需求进行参数设置，设置完成后单击确认。
在我的应用页面中找到已经创建的应用，单击进入应用，单击开始创建模板，在上传模板图片页面单击查看本地文件，上传字迹清晰且无旋转的模板图片，并根据数据特征配置相应的参数，配置完成后单击下一步。
提示建议
1. 模板图片如何选择？
  字迹清晰、摆放端正、无反光、字段全的扫描图片效果更佳。
  文档，支持不超过20M且后缀为PDF 的单页文件。
  图片，支持不超过10M且后缀为JPG、JPEG、PNG的文件。
2. 模板参数如何配置？
  模板参数设置样本的特征信息，便于对样本数据进行预处理和AI模型匹配，优化处理效果配置。
  支持语言、文字类型、图像处理、红章处理配置项。
  模板参数配置不实时生效和展示，模板测试环节可以正常生效。
3. 什么样的数据识别效果较好？
  单张图片最长边不超过8192像素，最短边不小于15像素。当长边超过1024像素时，长宽比不超过50 ：1 。
  建议单字大小保持在10-50像素内，以获得较好的识别效果。
  模板图与真实业务数据的拍照角度、方位有较大差别时，可影响识别效果。

步骤二 : 框选参照字段

在左侧工具栏选择框选按钮，框选模板图片中内容和位置都固定不变的文字区域作为参照字段。
在右侧参照字段区域根据您的需求配置参数，配置完成后单击下一步。参数说明如下：
参照字段：图片中文字及位置固定不变的字段区域，用于相同版式待识别图片的自动矫正与锚定匹配。如联合分类器使用，也会对其产生影响。
提示建议
1. 如何框选参照字段？
  框选4个以上参照字段，并尽量分散在四角。
  保证框选的文字内容、位置固定不变。
  单个字段不可跨行。
  选取图片中不会重复的文字。
  仅支持中英文、数字、不可包含符号、图案。
2. 实在没有4个以上可框选的参照字段，怎么办？
  直接跳过框选参照字段步骤，底层算法模型将自行分析，但联合分类器使用时对于版式十分相似的模板需仔细配置。

步骤三 : 配置识别字段

进入配置识别字段页面，在左侧工具栏选择框选按钮，框选模板图片中需要识别的字段区域。

在右侧区域填写字段名校对value值，并选择对应的字段类型和高级配置以提高识别准确率，配置完成后单击下一步。参数说明如下：

识别字段：识别字段是图片中需要被识别的区域，即业务中所期望使用的信息，用于输出结构化识别结果。每个识别字段包含字段名、Value值、字段类型的必选项，以及高级配置作为可选项。
字段名：识别字段对外透出的名称，即API接口中对应的名称，且字段名需全局唯一。
Value值：识别字段的内容，框选后可自动识别并填充。如有对特定字段的后处理需求（如日期的归一化、金额的纯数字提取、符号的正则替换等），可以通过字段类型和高级配置实现，在调用时生效。

提示建议

如何框选识别字段？
1. 逐个框选所需抽取字段的文字所在区域。
2. 识别字段框尽量覆盖该字段文字可能出现的最大范围，可以避免字段识别不完整。

如何提升识别字段准确率？

选择合适的字段类型以提升字段识别效果，支持选择通用字段或用户自行添加自定义字段。无需后处理选择常规字段类型即可。
如需内容替换或设置多行连接符的情况可通过配置高级配置完成。
高级配置中正则表达式支持用户通过字符串定义替换前和替换后的文字，示例如下：

备注	输入	原内容	替换内容	结果
替换字符串	`abcdef`	`abc`	`hello`	`hellodef`
去掉多余空格	`ab de f`	`\s+`	`-`	`ab de f`
倒数第二位数字前加小数点	`12345`	`(\d+)(\d{2})$`	`\1.\2`	`123.45`
去除冒号前内容	`Mobile:12345678`	`.+:(\d+)`	`\1`	`12345678`
日期格式转换	`2023-2-3`	`^(\d+)-(\d+)-(\d+)$`	`\1年\2月\3日`	`2023年2月3日`

步骤四 : 模板测试与发布

参照字段和识别字段全部框选完成后，即可进入模板测试与发布环节，点击查看本地文件上传相同版式图片测试模板效果，若效果满意即可发布模板并开始API调用。可通过重新上传按钮，测试多份数据的效果，同时可通过返回上一步进行效果调优。

模板调优与管理

模板调优建议

测试结果出现图片无法匹配模板的情况怎么办？
1. 确认上传的测试图片与模板图片是否为同一版式。
2. 调整参照字段框选范围或更换参照字段，以提升模板匹配准确率。
测试结果中出现识别结果不完整的情况怎么办？
1. 可调整识别区框选范围，框尽量覆盖该字段文字可能出现的最大范围，以完善此类情况。
2. 检查字段类型的选择，例如数字识别成字母，则可调整此识别字段的字段类型。
3. 检查字段的高级配置。
测试结果中出现识别字段错误怎么办？
1. 检查字段类型的选择，例如将常规调整为数字类型，可更加精准的识别字段。
2. 检查字段的高级配置。
测试结果选框偏移怎么办？
1. 检查参照字段或识别字段框选是否符合要求。
2. 检查模板图片是否符合要求。

模板管理

模板发布完成后，可通过项目详情进入项目概览，查看模板基本信息、模板信息以及调用数据。已发布的模板支持API调用和在线使用。

说明

需完成自定义KV模板服务开通，才可进行模板配置。
仅可已发布模板发起调用和在线使用，调用数据可在详情看板查看。API调用和在线使用均计费，具体产品计费可查看OCR文档自学习计费。