通用票证抽取结合读光OCR和通义千问大模型的能力,针对OCR不支持的长尾票据,提供关键KV信息抽取,例如名称、地址、开票日期等关键字段结构化识别输出。
接口说明
如何使用本接口
| 步骤 | 概述 | 
|---|---|
| 1 | 开通 OCR 统一识别 服务。本接口在公测阶段,是免费接口,开通后即可调用。 | 
| 3 | 可以参照调试页面 提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。 | 
重要提示
| 类型 | 概述 | 
|---|---|
| 图片格式 | 
 | 
| 图片尺寸 | 
 | 
| 图片大小 | 
 | 
| 其他提示 | 
 | 
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:- 对于必选的资源类型,用前面加 * 表示。
- 对于不支持资源级授权的操作,用全部资源表示。
 
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
| 操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 | 
|---|---|---|---|---|
| ocr:RecognizeGeneralStructure | none | *全部资源 * | 
 | 无 | 
请求参数
| 名称 | 类型 | 必填 | 描述 | 示例值 | 
|---|---|---|---|---|
| Url | string | 否 | 
 | https://example.png | 
| body | byte | 否 | 
 | 图片二进制文件 | 
| Keys | array | 否 | 
 | |
| string | 否 | 
 | "姓名" | 
返回参数
示例
正常返回示例
JSON格式
{
  "RequestId": "2F86F9B6-CF68-1574-860C-7CC5E46F14BC",
  "Data": {
    "Height": 2000,
    "Width": 1000,
    "SubImageCount": 1,
    "SubImages": [
      {
        "SubImageId": 0,
        "Angle": 0,
        "KvInfo": {
          "KvCount": 6,
          "Data": {
            "姓名": "呂XX(LOI XX)",
            "护照号码": "MBXX",
            "签发机关": "澳門特別行政區身份證明局",
            "出生日期": "19XX年X月X日",
            "出生地": "澳門 (MACAO)",
            "国家码": "CHN",
            "性别": "F (女性)"
          }
        }
      }
    ]
  },
  "Code": "LLMTimeout",
  "Message": "Large language model timeout, please try again with fewer keys."
}错误码
| HTTP status code | 错误码 | 错误信息 | 描述 | 
|---|---|---|---|
| 400 | ExceededKeyNumber | Too many keys, please try again with fewer keys. | 调用大模型超时,请减少抽取的Key数量,然后重试。 | 
| 400 | DataInspectionFailed | Input or output data may contain inappropriate content. | 数据检查错误,输入或者输出包含疑似敏感内容被绿网拦截。 | 
| 504 | LLMTimeout | Large language model timeout, please try again with fewer keys. | 调用大模型超时,请减少抽取的Key数量,然后重试。 | 
访问错误中心查看更多错误码。
变更历史
| 变更时间 | 变更内容概要 | 操作 | 
|---|---|---|
| 2024-07-10 | OpenAPI 错误码发生变更 | 查看变更详情 | 
