背景信息

抽取项目一般包含命名实体识别(NER)和文本抽取

操作步骤

  1. 新建文本抽取配置

    依次点击生产配置 -> 业务常用配置 -> 添加配置,类型选择文本抽取配置

  2. 添加标签
    • 根据需求添加抽取的标签 (P.S. NER生产界面不支持多层级标签)
    • 内容请不要包含以下符号:( 逗号,空格,^ )
    • 名称:填写抽取标签的名称,(返回的数据会以名称作为结果)
    • Weight:只有叶子节点有weight, 用来计算基于weight的NER错误率,(无需求,不用管,默认为1)
    • Add Child: 在这个节点下,添加子节点
    • Remove Item: 删除当前节点
    • 点击提交保存内容
  3. 批量添加
    • 下载批量添加模板
    • 根据模板和需求,按照抽取标签的层级关系修改excel模板,(第一行是列头,可随意填写)
    • 把修改后的模版上传后,检查生成的标签配置
    • 点击提交保存内容