全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网

通用识别

更新时间:2017-08-02 19:48:17

本页面主要介绍服务对应的接口和返回结果中的关键字段的含义,请在阅读本页面之前,了解请求数据格式介绍,了解输入输出的通用数据格式。 此外,在本页最后,附上了通用识别服务调用的程序示例,以供参考。

请求接口

  • 云市场接口
    • 请求方法: POST
    • 请求url: 在云市场搜索印刷文字识别-通用识别,在API接口中找到调用地址

请求参数

参数名称 参数类型 描述 默认值
image string dataType为50, dataValue是base64编码后的图像数据, 空字符串
configure string dataType为50, dataValue为json字符串, 其中包含两个字段,min_size, 表示检测最小文字的像素高度,如果是文档类,min_size建议设置小于5;如果是自然场景文字,建议使用默认值16; output_prob, 布尔型,是否输出文字区域的概率 空字符串

POST请求body 示例如下:

  1. {
  2. "inputs": [
  3. {
  4. "image": {
  5. "dataType": 50, #50表示image的数据类型为字符串
  6. "dataValue": "/9j/4AAQSkZJRgABAQAASABIAAD/2wBDAAUDBAQEAwUEBAQFBQUGBwwIBwcHBw8LCwkMEQ8SEhEPERETFhwXExQaFRERGCEYGh0dHx8fExciJCIeJBweHx7..." #图片以base64编码的string/oss图片链接
  7. },
  8. "configure": {
  9. "dataType": 50
  10. "dataValue": "{\"min_size\" : 16, \"output_prob\" : true}"
  11. }
  12. }]
  13. }

返回结果格式

返回结果格式如下:

  1. {
  2. "outputs": [
  3. {
  4. "outputLabel": "ocr_general",
  5. "outputMulti": {},
  6. "outputValue": {
  7. "dataType": 50,
  8. "dataValue": "{
  9. \"ret\":[
  10. {
  11. \"request_id\" : \"20170301160849_918cfcae128fc919ad6d6e3b865d2973\", #请求唯一标识,用于错误追踪
  12. \"prob\" : 0.99983, #文字区域概率
  13. \"rect\":{ #文字区域
  14. \"left\" : 50, #文字区域左上角x坐标
  15. \"top\" : 50, #文字区域左上角y坐标
  16. \"width\" : 100, #文字区域宽度
  17. \"height\" : 40 #文字区域高度
  18. },
  19. \"word\":\"文字内容\" #文字内容
  20. },
  21. {
  22. \"prob\" : 0.95983, #文字区域概率
  23. \"rect\":{ #文字区域
  24. \"left\" : 50, #文字区域左上角x坐标
  25. \"top\" : 50, #文字区域左上角y坐标
  26. \"width\" : 100, #文字区域宽度
  27. \"height\" : 40 #文字区域高度
  28. },
  29. \"word\":\"文字内容\" #文字内容
  30. }
  31. ],
  32. \"success\" : true
  33. }"
  34. }
  35. }]
  36. }

返回结果是json格式,存放在dataValue字段对应的json String(不是json object)中,主要有如下字段:

  • request_id: 请求唯一标识,用于错误追踪
  • ret: 返回结果数组,类型为json
  • rect: 文字区域, 类型为json object,其中left表示文字区域左上角x坐标, top表示文字区域左上角y坐标,width表示文字区域宽度, height表示文字区域高度
  • word: 文字识别结果,类型为字符串
  • success: 识别流程是否出现异常, false表示识别失败,true表示识别成功, 类型为布尔型

程序示例

云市场

云市场搜索印刷文字识别-通用识别,在API接口中找到请求示例

本文导读目录