全部产品
阿里云办公

文本扫描

更新时间:2018-06-25 20:02:32

接口描述

TextScanRequest

功能 支持的Region 描述
文本扫描接口 cn-shanghaicn-beijing 支持文本垃圾检测(scene=antispam)和文本关键词检测(scene=keyword)。

说明:提交检测的文本长度不长于4,000个字符,字符编码使用UTF-8。

自定义关键词

文本垃圾检测支持自定义关键词。例如添加一些竞品关键词等,您可以前往 云盾内容安全控制台 进行设置。支持批量导入关键词,关键词编码请使用UTF-8;批量导入的关键词默认自动对接口生效,生效延时约为15分钟。

检测结果说明

  • 文本垃圾检测(scene=antispam)返回结果判断依据:

    • suggestion == pass 未命中垃圾
    • suggestion == block 命中了垃圾,可以通过label字段查看命中的垃圾分类
  • 关键词检测(scene=keyword)返回结果判断依据:

    • suggestion == pass 未命中关键词
    • suggestion == block 命中了关键词,可以通过label字段查看命中的关键词分类

调用示例

  1. #coding=utf-8
  2. # 调用文本检测
  3. from aliyunsdkcore import client
  4. from aliyunsdkcore.profile import region_provider
  5. from aliyunsdkgreen.request.v20180509 import TextScanRequest
  6. import json
  7. import uuid
  8. import datetime
  9. # 请替换成您自己的accessKeyId、accessKeySecret。您可以修改配置文件,也可以直接明文替换
  10. clt = client.AcsClient("您的accessKeyId", "您的accessKeySecret",'cn-shanghai')
  11. region_provider.modify_point('Green', 'cn-shanghai', 'green.cn-shanghai.aliyuncs.com')
  12. request = TextScanRequest.TextScanRequest()
  13. request.set_accept_format('JSON')
  14. task1 = {"dataId": str(uuid.uuid1()),
  15. "content":"你真棒",
  16. "time":datetime.datetime.now().microsecond
  17. }
  18. # 文本垃圾检测: antispam
  19. # 关键词检测: keyword
  20. request.set_content(bytearray(json.dumps({"tasks": [task1], "scenes": ["antispam"]}), "utf-8"))
  21. response = clt.do_action(request)
  22. print response
  23. result = json.loads(response)
  24. if 200 == result["code"]:
  25. taskResults = result["data"]
  26. for taskResult in taskResults:
  27. if (200 == taskResult["code"]):
  28. sceneResults = taskResult["results"]
  29. for sceneResult in sceneResults:
  30. scene = sceneResult["scene"]
  31. suggestion = sceneResult["suggestion"]
  32. print suggestion
  33. print scene
  34. # 根据scene和suggetion做相关处理
  35. # do something