本文介绍PDF识别RecognizePdf的语法及示例。

功能描述

PDF识别可以对PDF上的文字进行结构化识别。

应用场景

  • 内容审核:可以结合内容审核能力对识别结果进行审核,检测文档中是否存在违规信息。
  • 企业报销: 可以对PDF格式的增值税发票结构化识别处理后实现报销场景下的自动化。

特色优势

  • 精准识别:智能算法升级,精准识别文件内容,保留原始排版。
  • 多语种识别:可识别中、英、中英混合等多语种内容。

前提条件

请确保您已开通文字识别服务,若未开通服务请立即开通

输入限制

  • 文件格式:PDF。
  • 文件大小:不超过10 MB。
  • 文档篇幅:PDF不超过5页。
  • URL地址中不能包含中文字符。

计费说明

关于PDF识别的计费方式及报价,请参见计费介绍

说明 下方调试接口为付费接口,如需免费体验调试请前往体验中心

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求参数

名称 类型 是否必选 示例值 描述
Action String RecognizePdf

系统规定参数。取值:RecognizePdf

FileURL String https://viapi-test.oss-cn-shanghai.aliyuncs.com/ocr/%E6%BB%B4%E6%BB%B4%E7%94%B5%E5%AD%90%E5%8F%91%E7%A5%A8A.pdf

文件URL地址。当前仅支持上海地域的OSS链接,如何生成URL请参见生成URL

返回数据

名称 类型 示例值 描述
RequestId String CD9A9659-ABEE-4A7D-837F-9FDF40879A97

请求ID。

Data Object

返回的结果数据内容。

Height Long 788

文档在图中旋转后的高度。

Width Long 1220

文档在图中旋转后的宽度。

OrgHeight Long 610

原图高度。

OrgWidth Long 394

原图宽度。

PageIndex Long 1

PDF页数。

Angle Long 0

PDF文件被旋转的角度。

WordsInfo Array of wordsInfo

文字信息。

Angle Long 0

被识别字段被旋转的角度。

Word String 发票代码:012002000211

文字信息。

Height Long 16

被识别字段的高度。

Width Long 205

被识别字段的宽度。

X Long 863

被识别字段左上角X坐标。

Y Long 46

被识别字段左上角Y坐标。

Positions Array of positions

文字信息位置。识别矩形框四个角的坐标顺时针排列,分别为左上XY坐标、右上XY坐标、右下XY坐标、左下XY坐标。

X Long 863

矩形框X坐标。

Y Long 43

矩形框Y坐标。

示例

请求示例

http(s)://ocr.cn-shanghai.aliyuncs.com/?Action=RecognizePdf
&FileURL=https://viapi-test.oss-cn-shanghai.aliyuncs.com/ocr/%E6%BB%B4%E6%BB%B4%E7%94%B5%E5%AD%90%E5%8F%91%E7%A5%A8A.pdf
&公共请求参数

正常返回示例

XML格式

HTTP/1.1 200 OK
Content-Type:application/xml

<RecognizePdfResponse>
    <RequestId>CD9A9659-ABEE-4A7D-837F-9FDF40879A97</RequestId>
    <Data>
        <WordsInfo>
            <Word>天津增值税</Word>
            <Angle>-88</Angle>
            <X>514</X>
            <Positions>
                <X>397</X>
                <Y>45</Y>
            </Positions>
            <Positions>
                <X>662</X>
                <Y>52</Y>
            </Positions>
            <Positions>
                <X>661</X>
                <Y>82</Y>
            </Positions>
            <Positions>
                <X>396</X>
                <Y>75</Y>
            </Positions>
            <Y>-69</Y>
            <Height>265</Height>
            <Width>29</Width>
        </WordsInfo>
        <WordsInfo>
            <Word>普通发票</Word>
            <Angle>0</Angle>
            <X>678</X>
            <Positions>
                <X>678</X>
                <Y>48</Y>
            </Positions>
            <Positions>
                <X>824</X>
                <Y>47</Y>
            </Positions>
            <Positions>
                <X>824</X>
                <Y>76</Y>
            </Positions>
            <Positions>
                <X>678</X>
                <Y>77</Y>
            </Positions>
            <Y>48</Y>
            <Height>29</Height>
            <Width>146</Width>
        </WordsInfo>
        <WordsInfo>
            <Word>发票代码:012002000211</Word>
            <Angle>0</Angle>
            <X>863</X>
            <Positions>
                <X>863</X>
                <Y>46</Y>
            </Positions>
            <Positions>
                <X>1068</X>
                <Y>46</Y>
            </Positions>
            <Positions>
                <X>1068</X>
                <Y>62</Y>
            </Positions>
            <Positions>
                <X>863</X>
                <Y>62</Y>
            </Positions>
            <Y>46</Y>
            <Height>16</Height>
            <Width>205</Width>
        </WordsInfo>
        <OrgWidth>610</OrgWidth>
        <Angle>0</Angle>
        <OrgHeight>394</OrgHeight>
        <Height>788</Height>
        <PageIndex>1</PageIndex>
        <Width>1220</Width>
    </Data>
</RecognizePdfResponse>

JSON格式

HTTP/1.1 200 OK
Content-Type:application/json

{
  "RequestId" : "CD9A9659-ABEE-4A7D-837F-9FDF40879A97",
  "Data" : {
    "WordsInfo" : [ {
      "Word" : "天津增值税",
      "Angle" : -88,
      "X" : 514,
      "Positions" : [ {
        "X" : 397,
        "Y" : 45
      }, {
        "X" : 662,
        "Y" : 52
      }, {
        "X" : 661,
        "Y" : 82
      }, {
        "X" : 396,
        "Y" : 75
      } ],
      "Y" : -69,
      "Height" : 265,
      "Width" : 29
    }, {
      "Word" : "普通发票",
      "Angle" : 0,
      "X" : 678,
      "Positions" : [ {
        "X" : 678,
        "Y" : 48
      }, {
        "X" : 824,
        "Y" : 47
      }, {
        "X" : 824,
        "Y" : 76
      }, {
        "X" : 678,
        "Y" : 77
      } ],
      "Y" : 48,
      "Height" : 29,
      "Width" : 146
    }, {
      "Word" : "发票代码:012002000211",
      "Angle" : 0,
      "X" : 863,
      "Positions" : [ {
        "X" : 863,
        "Y" : 46
      }, {
        "X" : 1068,
        "Y" : 46
      }, {
        "X" : 1068,
        "Y" : 62
      }, {
        "X" : 863,
        "Y" : 62
      } ],
      "Y" : 46,
      "Height" : 16,
      "Width" : 205
    } ],
    "OrgWidth" : 610,
    "Angle" : 0,
    "OrgHeight" : 394,
    "Height" : 788,
    "PageIndex" : 1,
    "Width" : 1220
  }
}

错误码

关于PDF识别的错误码,详情请参见常见错误码

SDK参考

阿里云视觉AI能力支持使用SDK调用,具体可参见SDK总览下载安装。

安全声明

  • 请确保上传的图片或文件来源符合相应的法律法规。
  • 通过体验调试上传的临时文件有效期为1小时,在24小时后会被系统自动清理删除。