全部产品
阿里云办公

智能文档分类

更新时间:2018-09-12 18:06:56

对用户输入的一段文本,映射到具体的类目上。

支持的类目体系可以是平层类目或者以树状形式组织的层次类目,系统内置两种默认分类体系:新闻资讯领域类目体系、电商领域类目体系。其中:

  • 新闻资讯分为15个类目(健康、观点、旅游、经济、房产、文娱、社会、国际、消费、从政、数码、汽车、教育、体育、防腐前沿);
  • 电商领域类目分为3层,以树的形式组织,一共有200个左右的类目。

同时支持对用户输入的文本,识别出其中的关键词,并给出每个关键词的类别信息(产品词、品牌词、人物等)。关键词会根据文本所属的不同领域信息来进行抽取。目前支持新闻资讯领域和电商领域的关键词打标。

请求方法说明

HTTP方法

POST

请求URL

https://nlp.cn-shanghai.aliyuncs.com/nlp/api/textstructure/{Domain}

参数名 参数值
Domain 领域模型选择,当前支持ecommerce(电商领域)与news(新闻领域)两大类领域模型

Header

Content-Type application/json

body请求体

  1. {
  2. "text":"脚蹬Mra,帅里帅气Mra是2013年新崛起的新锐品牌,作为Mra的大Boss福叔他爱鞋如痴,从皮料到包装他都严格把关,当收集到足够多的意见后,他总会用纯手工打扮出第一双样鞋,然后再不断 的调整改进,>每双都能精益求精!福叔常说要用品质为顾客撑腰,因此Mra都是选用的上等小牛皮加工,由经验丰富的老工匠在一边亲自操刀。",
  3. "tag_flag":"true"
  4. }

参数说明

参数名 参数值
text 输入的文本
tag_flag 是否需要关键词抽取功能

返回结果

  1. {
  2. "data":{
  3. "tags":"鞋:产品词;上等:产品修饰词;Mra:普通词;选用:产品修饰词;崛起:机构实体;新锐:产品修饰词;老工匠:产品词;精益求精:机构实体;福叔:普通词;帅气:产品修饰词",
  4. "label_name":"运动/户外"}
  5. }

结果参数说明:

参数名 参数值
tags 文本的关键词以及其对应属性
labels_name 文本的分类结果