背景信息

抽取项目一般包含命名实体识别(NER)和文本抽取。

操作步骤

  1. 新建文本抽取配置。

    依次点击生产配置 -> 业务常用配置 -> 添加配置,类型选择文本抽取配置。

  2. 添加标签。
    • 根据需求添加抽取的标签 (P.S. NER生产界面不支持多层级标签)。
    • 内容请不要包含以下符号:( 逗号,空格,^ )。
    • 名称:填写抽取标签的名称,(返回的数据会以名称作为结果)。
    • Weight:只有叶子节点有weight, 用来计算基于weight的NER错误率,(无需求,不用管,默认为1)。
    • Add Child: 在这个节点下,添加子节点。
    • Remove Item: 删除当前节点。
    • 点击提交保存内容。
  3. 批量添加。
    • 下载批量添加模板。
    • 根据模板和需求,按照抽取标签的层级关系修改Excel模板,(第一行是列头,可随意填写)。
    • 把修改后的模版上传后,检查生成的标签配置。
    • 点击提交保存内容。