NLP自学习平台提供了一些预训练的特定领域模型服务。例如:商品评价解析服务、新闻层次分类服务、中文简历抽取、英文简历抽取。

服务开通与资源包购买

预训练模型使用前,需要确认是否已经开通了:自然语言处理和NLP自学习平台服务。

自然语言处理:开通地址

NLP自学习平台:开通地址

说明 预训练模型提供累计500次的免费调用量,超过500次需要购买资源包:购买地址

使用NLP自学习平台SDK

引入NLP自学习平台的SDK,查看最新SDK版本

<dependency>    
  <groupId>com.aliyun</groupId>
  <artifactId>aliyun-java-sdk-core</artifactId>
  <version>3.5.0</version>
</dependency>
<dependency>
  <groupId>com.aliyun</groupId>
  <artifactId>aliyun-java-sdk-nlp-automl</artifactId>
  <version>0.0.5</version>
</dependency>

API文档参考:API地址

API测试参考:API测试

商品评价解析服务

商品评价解析服务使用示例。

Java代码示例

DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou","your-access-id-key","your-access-id-secret");
IAcsClient client = new DefaultAcsClient(defaultProfile);
String content = "{\"input\": {\"content\": \"这件衣服真好看\", \"domain\": \"clothing\", \"entity\": true } }";
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("ReviewAnalysis");
request.setPredictContent(content);
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json

from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest

# Initialize AcsClient instance
client = AcsClient(
  "<your-access-id-key>",
  "<your-access-id-secret>",
  "cn-hangzhou"
);

content = '这件衣服真好看'
domain = 'clothing'
input_params = {
    "input": {
        "content": content,
        "domain": domain,
        "entity": True
    }
}

# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('ReviewAnalysis')
request.set_PredictContent(json.dumps(input_params))

# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(json.dumps(predict_result['data']))
说明 调用商品评价解析服务,ServiceName需要传入:ReviewAnalysis

PredictContent内容示例

说明 PredictContent参数为JSON字符串传入,JSON字符串包含内容参考下面举例。
{
  "input": {
    "content": "衣服款式很好看",
    "domain": "clothing",
    "entity": true
  }
}

入参说明

参数 说明
content 需要预测的文本内容。
domain 支持商品类目。参考下一章节的类目支持表格。
entity 值为true时返回结果包含属性情感词抽取结果,否则不包含

商品类目支持表

类目 类目code 属性类别
水产肉类 aquaticmeat 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,重量,颜色,口感,细节,新鲜度,干净度,个头,水分,咸度,成熟度,保质期,吃坏,甜度,手感
咖啡麦片冲饮 coffe 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,工艺,重量,异味/气味,食用效果,颜色,口感,个头,保质期,冲泡效果,便利性
时尚饰品 fashion 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,工艺,功能,异味/气味,外观,颜色,款式,尺码/尺寸,佩戴效果
粮油米面 grainoil 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,重量,体验,颜色,口感,新鲜度,干净度,个头,水分,手感,咸度,成熟度,保质期,吃坏,甜度,细节
保健食品 healthfood 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,重量,异味/气味,食用效果,口感,保质期,冲泡效果,便利性
灯饰光源 light 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,能耗,材质,外观,使用效果,颜色,配件,亮度,体积,安装
办公用品 todo 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,重量,操作性,空间,异味/气味,材质,外观,颜色,显示/打印效果,系统性能,体积,安装,速度,声音
滋补营养品 nourishment 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,异味/气味,重量,耐泡度,颜色,口感,新鲜度,粉质,干净度,个头,保质期,泡发性
电器类 lifeelectric 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,便携性,重量,操作性,外观,使用效果,颜色,体积,安装,便利性,声音,细节
通讯类 lifeelectriccommucation 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,电池/续航时间,重量,对讲/通话效果,操作性,信号,外观,颜色,体积,传播距离,声音,便携性
电热毯类 lifeelectricblanket 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,面料/材质,制热效果,功能,味道,做工,操作性,体验,图案,颜色,尺码/尺寸,安全性,保温效果,声音
电扇类 lifeelectricfan 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,风力/风速,功能,做工,重量,操作性,体验,外观,颜色,体积,安装,声音,细节
酒类 wine_ann 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,工艺,异味/气味,醉酒性,年份,外观,口感,颜色,原料,体积,酒精度数
电视机 television 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,体积,做工,功能,重量,操作性,异味/气味,材质,能耗,内容资源,内存,外观,颜色,配件,设计,系统性能,显示效果,安装,厚薄度,声音
热水器 waterheat 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,制热效果,做工,重量,操作性,保温/控温/加热效果,材质,出水性,能耗,外观,颜色,容量,设计,安全性,体积,安装,声音
洗衣机 washingmachine 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,脱水/烘干效果,功能,异味/气味,能耗,重量,材质,操作性,安装,外观,颜色,容量,体积,声音/震动,洗涤效果
制冷设备 refrigeration 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,制冷/保鲜效果,重量,操作性,异味/气味,材质,能耗,箱门结构,外观,颜色,容量,体积,安装,工作方式,厚薄度,声音
眼镜行业 glasses 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,材质,颜色,款式,配件,尺码/尺寸,设计,佩戴效果,清晰度
小球类 littleball 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,异味/气味,重量,耐用性,材质,外观,颜色,飞行稳定性,尺码/尺寸,圆度,软硬度,手感,弹性
大球类 bigball_ann 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,控球性,做工,异味/气味,重量,耐用性,材质,外观,颜色,漏气,配件,充气,尺码/尺寸,软硬度,弹性,手感
骑行配饰 cycling 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,透气性,做工,功能,异味/气味,材质,颜色,款式,防水性,保暖性,速干效果,尺码/尺寸,舒适度,色牢度,厚薄度,手感,弹性
手机行业 cellphone 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,功能,拍照效果,电池/续航能力,内存,外观,使用效果,颜色,屏幕,配件,系统性能,声音,手感
箱包行业 bags_ann 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,色差,功能,做工,异味/气味,重量,密封性,材质,颜色,款式,容量,实用性,配件,尺码/尺寸,牢固度,手感
内衣行业 underwear 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,面料/材质,做工,缩水,异味/气味,耐穿性,颜色,款式,保暖性,尺码/尺寸,聚拢效果,舒适度,色牢度,厚薄度,手感,弹性
手表行业 watch 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,异味/气味,操作性,材质,外观,颜色,防水性,校准,佩戴效果
球类配饰 ballaccessory 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,服帖性,重量,异味/气味,防滑效果,声音,材质,外观,颜色,防水性,吸水性,粘性,尺码/尺寸,磁性,安装,清洗效果,使用效果/球感效果,软硬度,弹性,手感
自行车类 bicycle 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,灯光,色差,功能,做工,重量,材质,外观,颜色,尺码/尺寸,设计,安全性,安装,骑行感受,声音,手感
家装主材 decoration 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,制热效果,重量,异味/气味,密封性,材质,出水性,能耗,使用效果,款式,水冲力,尺码/尺寸,设计,安全性,亮度,安装,声音,手感
纸尿裤 diaper 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,吸收度,透气性,柔软度,材质,外观,使用效果,贴身性
奶粉 milk 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,异味/气味,颜色,口感,便利性,保质期,质地,溶解性
零食 snacks 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,辣度,味道,异味/气味,重量,口感,成分,保质期,肉质,甜度
床上用品 beddings 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,缩水,重量,异味/气味,图案,材质,颜色,款式,保暖性,尺码/尺寸,舒适度,色牢度,厚薄度,手感,软硬度
住宅家具 furniture 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,色差,做工,异味/气味,材质,外观,颜色,款式,手感,安全性,舒适度,厚重感,便利性,声音,软硬度
鞋类行业 shoes 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,做工,功能,异味/气味,材质,上身效果,外观,颜色,款式,尺码/尺寸,色牢度
服饰行业 clothing 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,版型,透气性,功能,做工,厚薄度,异味/气味,材质,填充物及含量,上身效果,颜色,款式,保暖性,尺码/尺寸,舒适度,起球,色牢度,面料,弹性,手感
美妆&彩妆行业 beauty 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,美白效果,丰胸效果,使用效果,颜色,抗衰效果,成分,收毛孔效果,遮瑕效果,祛痘祛印效果,隔离效果,补水保湿效果,密封度,防晒效果,纤体效果,紧致效果,质地,祛斑淡斑效果,去黑头效果,异味/气味,妆感,控油效果,清洁效果,保质期
女装类 dress 质量,卖家服务,性价比,物流,正品,包装,整体,赠品,填充物及含量,颜色,款式,尺码/尺寸,起球,色牢度,缩水,保暖性,破洞,面料,弹性,透气性,做工,图案,厚薄度,色差,异味/气味,上身效果,对称,线头,手感

PredictResult内容示例

说明 PredictResult是JSON字符串,需要反序列化之后进行解析,具体结构如下示例。
{
    "code": 1000,
    "data": {
        "aspectItem": [
            {
                "aspectCategory": "款式",
                "aspectPolarity": "正",
                "clause": "衣服款式很好看",
                "clauseIndex": "0,7",
                "negativeProb": 0,
                "positiveProb": 0.999,
                "terms": [
                    {
                        "aspectTerm": "款式",
                        "opinionTerm": "好看"
                    }
                ]
            }
        ],
        "cost": "13.652ms",
        "textPolarity": "正",
        "textProb": 0.9972
    },
    "message": "SUCCESS",
    "tracerId": "55826e2a-23d0-4664-905f-59010bfecd2a"
}

出参说明

字段 说明
textPolarity 整条文本情感极性:正、中、负
textProb 整条文本情感极性置信度(取值范围[0,1],越大代表整条文本为textPolarity对应情感极性的概率越高)
aspectItem 属性情感列表,每个元素是一个json字段
aspectCategory 属性类别
aspectPolarity 属性片段极性(正、中、负)
clause 情感子句
clauseIndex 情感子句所在的起始位置,终结位置
positiveProb 情感正向置信度(取值范围[0,1],越大代表情感正向概率越高)
negativeProb 情感负向置信度(取值范围[0,1],越大代表情感负向概率越高)
terms 抽取的属性情感词列表,每个元素是一个json字段
aspectTerm 属性词
opinionTerm 情感词

新闻层次分类服务

新闻层次分类服务使用示例。

Java代码示例

DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou","your-access-key-id","your-access-id-secret");
IAcsClient client = new DefaultAcsClient(defaultProfile);
String content = "[\"北京时间4月18日,凯尔特人主场以99-91击退了步行者,总比分2-0领先\",\"《大军师司马懿》近日登陆日本播出,当地网友纷纷称赞该剧制作考究,司马懿诸葛亮曹操等人物出彩,吴秀波、于和伟等演技也获赞\"]";
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("NewsClassification");
request.setPredictContent(content);
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json

from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest

# Initialize AcsClient instance
client = AcsClient(
  "<your-access-key-id>",
  "<your-access-key-secret>",
  "cn-hangzhou"
);

content = []
content.append('北京时间4月18日,凯尔特人主场以99-91击退了步行者,总比分2-0领先')
content.append('《大军师司马懿》近日登陆日本播出,当地网友纷纷称赞该剧制作考究,司马懿诸葛亮曹操等人>物出彩,吴秀波、于和伟等演技也获赞')

# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('NewsClassification')
request.set_PredictContent(json.dumps(content))

# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(predict_result['result'])
说明 调用新闻层次分类服务,ServiceName需要传入:NewsClassification

PredictContent内容示例

说明 PredictContent参数为JSON字符串传入,JSON字符串包含内容参考下面举例。
[
  "北京时间4月18日,凯尔特人主场以99-91击退了步行者,总比分2-0领先",
  "《大军师司马懿》近日登陆日本播出,当地网友纷纷称赞该剧制作考究,司马懿诸葛亮曹操等人物出彩,吴秀波、于和伟等演技也获赞"
]

入参可以同时传入多个文本,多个文本需要封装为JsonArray接口,并序列化成Json字符串。

PredictResult内容示例

说明 PredictResult是JSON字符串,需要反序列化之后进行解析,具体结构如下示例。
{
  "ret_code": 0,
  "message": "",
  "time": 100,
  "result": [
    [
      "news_sports",
      "news_sports_basketball"
    ],
    [
      "news_entertainment",
      "news_entertainment_film_tv"
    ]
  ]
}

出参result是一个JSON字符串,是一个JsonArray结构。

简历抽取(中文)

简历抽取服务使用示例。

Java代码示例

DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou","your-access-key-id","your-access-key-secret");
IAcsClient client = new DefaultAcsClient(defaultProfile);
String content = "简历文本";
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("ResumeExtractorZH");
request.setPredictContent(content);
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json

from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest

# Initialize AcsClient instance
client = AcsClient(
  "<your-access-key-id>",
  "<your-access-key-secret>",
  "cn-hangzhou"
);

content = '简历文本'

# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('ResumeExtractorZH')
request.set_PredictContent(content)

# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(predict_result['result'])
说明 调用简历抽取(中文)服务,ServiceName需要传入:ResumeExtractorZH

PredictContent内容示例

说明 PredictContent参数为简历文本参数。

PredictResult内容示例

说明 PredictResult是JSON字符串,需要反序列化之后进行解析,具体结构如下示例。
{
    "ret_code": 0,
    "result": [{
        "id": 0,
        "tags": [{
            "class": "姓名",
            "source": "rule",
            "span": "张维"
        }],
        "sentence": "张维 ID:61969461",
        "sent_offsets": 0
    }, {
        "id": 0,
        "tags": [{
            "conf": 0,
            "class": "手机号",
            "span": "186xxxx329",
            "start": 0,
            "source": "model",
            "end": 11
        }],
        "sentence": "18664347329",
        "sent_offsets": 2
    }, {
        "id": 0,
        "tags": [{
            "class": "电子邮箱",
            "source": "rule",
            "span": "wwt5150@126.com"
        }],
        "sentence": "wwt5150@126.com",
        "sent_offsets": 3
    }, {
        "id": 0,
        "tags": [{
            "conf": 0,
            "class": "出生日期",
            "span": "1990/07/27",
            "start": 8,
            "source": "model",
            "end": 18
        }, {
            "class": "性别",
            "source": "rule",
            "span": "男"
        }],
        "sentence": "男|29 岁 (1990/07/27)|现居住南京-玄武区|8年工作经验",
        "sent_offsets": 4
    }, {
        "id": 0,
        "tags": [{
            "conf": 0,
            "class": "岗位名称",
            "span": "软件测试工程师",
            "start": 4,
            "source": "model",
            "end": 11
        }],
        "sentence": "职位: 软件测试工程师",
        "sent_offsets": 6
    }],
    "message": "",
    "time": 143
}

出参result是一个JSON字符串,是一个JsonArray结构。

简历抽取(英文)

简历抽取服务使用示例。

Java代码示例

DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou","your-access-key-id","your-access-key-secret");
IAcsClient client = new DefaultAcsClient(defaultProfile);
String content = "Resume Text";
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("ResumeExtractorEN");
request.setPredictContent(content);
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json

from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest

# Initialize AcsClient instance
client = AcsClient(
  "<your-access-key-id>",
  "<your-access-key-secret>",
  "cn-hangzhou"
);

content = 'Resume Text'

# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('ResumeExtractorEN')
request.set_PredictContent(content)

# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(predict_result['result'])
说明 调用简历抽取(英文)服务,ServiceName需要传入:ResumeExtractorEN

PredictContent内容示例

说明 PredictContent参数为简历文本参数。

PredictResult内容示例

说明 PredictResult是JSON字符串,需要反序列化之后进行解析,具体结构如下示例。
{
    "result": "{\"Schools\": [{\"School\": \"The Hong Kong Polytechnic University\", \"Degree\": null, \"StartDate\": \"2002-1-1\", \"EndDate\": \"2004-1-1\", \"DegreeCode\": null, \"SchoolDuration\": \"2002 - 2004\"}, {\"School\": \"University of British Columbia\", \"Degree\": \"Masters\", \"StartDate\": \"2000-3-1\", \"EndDate\": null, \"DegreeCode\": \"master\", \"SchoolDuration\": \", Mar\"}, {\"School\": \"University of British Columbia\", \"Degree\": \"Masters\", \"StartDate\": \"2000-3-1\", \"EndDate\": null, \"DegreeCode\": \"master\", \"SchoolDuration\": \", Mar\"}], \"Name\": \"John Smith\", \"Lang\": \"en\", \"Phone\": \"+852 1111 1234\", \"CountryCode\": \"852\", \"RegionalPhone\": \"11111234\", \"FamilyName\": \"Smith\", \"GivenName\": \"John\", \"City\": \"Hong Kong\", \"Email\": \"john.smith@gmail.com\", \"Companies\": [{\"Position\": null, \"EndDate\": \"2012-12-1\", \"Company\": \"Aurostyle Limited\", \"StartDate\": \"2010-6-1\", \"CompanyDuration\": \"June 2010 \u2013 December 2012\"}, {\"Position\": null, \"EndDate\": \"2010-6-1\", \"Company\": \"Waddy Jewellery Group Limited\", \"StartDate\": \"2007-6-1\", \"CompanyDuration\": \"June 2007 \u2013 June 2010\"}]}",
    "time": 128,
    "message": "",
    "ret_code": 0
}

出参result是一个JSON字符串,是一个JSON字符串,具体结构如下所示。

{
    "Schools": [{
        "School": "The Hong Kong Polytechnic University",
        "StartDate": "2002-1-1",
        "EndDate": "2004-1-1",
        "SchoolDuration": "2002 - 2004"
    }, {
        "School": "University of British Columbia",
        "Degree": "Masters",
        "StartDate": "2000-3-1",
        "DegreeCode": "master",
        "SchoolDuration": ", Mar"
    }, {
        "School": "University of British Columbia",
        "Degree": "Masters",
        "StartDate": "2000-3-1",
        "DegreeCode": "master",
        "SchoolDuration": ", Mar"
    }],
    "Name": "John Smith",
    "Lang": "en",
    "Phone": "+852 1111 1234",
    "CountryCode": "852",
    "RegionalPhone": "11111234",
    "FamilyName": "Smith",
    "GivenName": "John",
    "City": "Hong Kong",
    "Email": "john.smith@gmail.com",
    "Companies": [{
        "Position": null,
        "EndDate": "2012-12-1",
        "Company": "Aurostyle Limited",
        "StartDate": "2010-6-1",
        "CompanyDuration": "June 2010 \u2013 December 2012"
    }, {
        "Position": null,
        "EndDate": "2010-6-1",
        "Company": "Waddy Jewellery Group Limited",
        "StartDate": "2007-6-1",
        "CompanyDuration": "June 2007 \u2013 June 2010"
    }]
}

裁判文书抽取

裁判文书抽取使用示例。

Java代码示例

DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou","your-access-id-key","your-access-id-secret");
IAcsClient client = new DefaultAcsClient(defaultProfile);
String content = "{\"reqId\":\"xxx\",\"cause\":[\"故意伤害罪\"],\"content\":\"文书正文,一定要保留换行符 \\n\",\"services\":[\"normal\",\"liangxing\"]}";
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("LegalDocumentExtraction");
request.setPredictContent(content);
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json

from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest

# Initialize AcsClient instance
client = AcsClient(
  "<your-access-id-key>",
  "<your-access-id-secret>",
  "cn-hangzhou"
);

input_params = {
        "reqId": "xxx",
        "cause": ["故意伤害罪"],
        "content": "文书正文",
        "services":["normal","liangxing"], 
}

# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('LegalDocumentExtraction')
request.set_PredictContent(json.dumps(input_params))

# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(json.dumps(predict_result['data']))
说明 裁判文书抽取服务,ServiceName需要传入:LegalDocumentExtraction

PredictContent内容示例

说明 PredictContent参数为JSON字符串传入,JSON字符串包含内容参考下面举例。
{
  "reqId": "xxx",
  "cause": ["故意伤害罪"],
  "content": "文书正文",
  "services":["normal","liangxing"]
 }

入参说明

参数 说明
reqId 自定义请求ID。
cause 案由。
content 文书正文内容,string
services 选择服务类型。normal:标准字段解析;liangxing:量刑字段解析
说明 案由支持多案由,传入JsonArray,不知道传空数组‘[]’
说明 服务类型可以单独解析输出也可以合并解析输出
,
说明 支持以上10个案由的文书解析,输入的案由如果不在列表中,算法会根据自己判断输出刑事或者民事的通用字段,暂时不支持行政类别的字段
说明 优先使用用户指定的案由名称,只有当输入案由不在支持列表中或者为空时才会使用算法判断案由

案由枚举值

案由
交通肇事罪
寻衅滋事罪
故意伤害罪
盗窃罪
开设赌场罪
走私、贩卖、运输、制造毒品罪
危险驾驶罪
诈骗罪
民间借贷纠纷
公益诉讼

PredictResult内容示例

参数 说明
reqId 请求id, string,与输入对应
result 结果结构体, json
说明 result结构如下
参数 说明
extract 代表信息抽取内容
laws 代表从文书中抽取的法条内容
segments 代表具体裁判文书分段内容
说明 segments枚举值如下所示
segments
诉讼参与人
法官助理
第三人陈述
原审情况(重审情况)
诉请
反诉
标题
法律效力
原审情况(再审情况)
事实认定
原审情况(一审辩称)
原审情况(反诉辩称)
裁判结果
案号
裁判日期
原审情况(二审判决结果)
反诉辩称
原审情况(一审事实认定)
原审情况(一审第三人陈述)
原审情况(二审诉请)
审理经过
抗诉
被诉行政行为情况
原审情况(一审裁判结果)
法院
原审情况(二审第三人陈述)
其他
辩称
证据段
原审情况(二审辩称)
文书类型
审判人员
原审情况(一审诉请)
原审情况(反诉)
原审情况(二审事实认定)
书记员
附件
原审情况(抗诉情况)
说明 PredictResult是JSON字符串,需要反序列化之后进行解析,具体结构如下示例。
{
    "reqId": "003",
    "result": {
        "extract": {
            "交通肇事罪-是否为逃避法律追究逃离事故现场": "否",
            "交通肇事罪-是否因逃逸致人死亡": "否",
            "交通肇事罪-是否存在肇事逃逸情形": "否",
            "交通肇事罪-是否存在超载情形": "否",
            "交通肇事罪-是否存在酒驾、毒驾情形": "否",
            "交通肇事罪-是否无驾驶资格驾驶": "否",
            "交通肇事罪-是否是代驾": "否",
            "交通肇事罪-是否致人死亡": "是",
            "交通肇事罪-是否致人重伤": "否",
            "交通肇事罪-是否致公私财产遭受重大损失": "否",
            "交通肇事罪-是否获得受害人或家属谅解": "否",
            "交通肇事罪-是否被交通肇事罪或交通肇事罪处置过": "否",
            "交通肇事罪-是否购买保险": "否",
            "交通肇事罪-是否适用非监禁刑罚": "是",
            "交通肇事罪-肇事车辆是否符合国家机动车安全技术标准": "是",
            "交通肇事罪-被告对公诉机关指控是否有异议": "否",
            "交通肇事罪-赔偿受害人或家属金额": [
                "238000元"
            ],
            "交通肇事罪-驾驶人驾驶的是否是校车": "否",
            "刑事通用-公诉机关名称": [
                "河北省高碑店市人民检察院"
            ],
            "刑事通用-判决依据法律条文": [
                "《中华人民共和国刑法》第七十三条第二",
                "《中华人民共和国刑法》第七十二条第一款",
                "《中华人民共和国刑法》第一百三十三条",
                "《中华人民共和国刑法》第六十七条"
            ],
            "刑事通用-判决时间": [
                "2014年10月16日"
            ],
            "刑事通用-制作单位": [
                "河北省高碑店市人民法院"
            ],
            "刑事通用-审判组织": "独任审判",
            "刑事通用-庭审方式": "公开审理",
            "刑事通用-文书名称": [
                "刑事判决书"
            ],
            "刑事通用-文书种类": "判决书",
            "刑事通用-文号": [
                "(2014)高刑初字第1222号"
            ],
            "刑事通用-案件审理阶段": "一审",
            "刑事通用-案发地点": [
                "沿老112国道由北向南行驶至高碑店市高静园公墓路口处"
            ],
            "刑事通用-案发时间": [
                "2013年12月31日7时40分"
            ],
            "刑事通用-被告信息": [
                {
                    "事故责任认定": "主要责任",
                    "刑期": "有期徒刑一年一个月,缓刑二年",
                    "是否为人大代表、政协委员": "否",
                    "是否为民主党派": "否",
                    "是否为涉台人员": "否",
                    "是否为涉外人员": "否",
                    "是否为涉港澳人员": "否",
                    "是否为累犯": "否",
                    "是否有从轻或减轻情节": "是",
                    "是否有从重情节": "否",
                    "是否系主犯": "否",
                    "是否系从犯": "否",
                    "是否系未成年人": "否",
                    "是否系首要分子": "否",
                    "构成罪名": [
                        "交通肇事罪"
                    ],
                    "特殊身份信息": [],
                    "罚金-具体金额": "",
                    "罚金-是否缴清": "",
                    "被告出生日期": "",
                    "被告别名": "",
                    "被告姓名": "刘某",
                    "被告户籍所在地": "",
                    "被告文化水平": "",
                    "被告民族": "",
                    "被告现居住地": "",
                    "被告籍贯": "",
                    "被告职业": "农民",
                    "起诉罪名": [
                        "交通肇事罪"
                    ]
                }
            ],
            "刑事通用-被告触犯法律条文": [],
            "刑事通用-起诉书文号": [
                "高检公诉刑诉(2014)240号"
            ]
        },
        "laws": [
            {
                "lawName": "中华人民共和国刑法",
                "provisionFullName": "中华人民共和国刑法第一百三十三条",
                "provisionID": 133,
                "provisionName": "一百三十三"
            },
            {
                "lawName": "中华人民共和国刑法",
                "provisionFullName": "中华人民共和国刑法第六十七条",
                "provisionID": 67,
                "provisionName": "六十七"
            },
            {
                "lawName": "中华人民共和国刑法",
                "provisionFullName": "中华人民共和国刑法第七十二条第一款",
                "provisionID": 72,
                "provisionName": "七十二"
            },
            {
                "lawName": "中华人民共和国刑法",
                "provisionFullName": "中华人民共和国刑法第七十三条第二",
                "provisionID": 73,
                "provisionName": "七十三"
            }
        ],
        "segments": {
            "书记员": "书记员刘秀坤",
            "事实认定": "另查明,案发后,双方达成协议,由被告人刘某的亲属代其一次性赔偿被害人家人各项经济损失共计人民币238000元。\n上述事实,被告人在开庭审理过程中亦无异议,并有道路交通事故现场图、现场勘验笔录及照片、法医学尸体检验意见书、车辆检验意见书、道路交通事故认定书、机动车驾驶证查询结果、赔偿调解书及收条、被告人的户籍证明等证据证实,足以认定。",
            "审判人员": "审判员刘利刚",
            "审理经过": "高碑店市人民检察院以高检公诉刑诉(2014)240号起诉书指控被告人刘某犯交通肇事罪,向本院提起公诉。本院依法适用简易程序,实行独任审判,公开开庭审理了本案,高碑店市人民检察院检察员张志英、代理检察员翟静出庭支持公诉,被告人刘某到庭参加了诉讼。现已审理终结。",
            "文书类型": "刑事判决书",
            "案号": "(2014)高刑初字第1222号",
            "法律效力": "如不服本判决,可于接到判决书的第二天起十日内,通过本院或者直接向河北省保定市中级人民法院提出上诉。书面上诉的,应提交上诉状正本一份,副本二份。",
            "法院": "河北省高碑店市人民法院",
            "裁判日期": "二〇一四年十月十六日",
            "裁判结果": "本院认为,被告人刘某违反交通运输管理法规,因而发生重大事故致使一人死亡,负事故的主要责任,其行为构成交通肇事罪,公诉机关指控的罪名成立。事故发生后,被告人刘某拨打报警电话,并在现场等待,公安交警人员到达现场后,其如实供述自己罪行,系自首,依法可予以从轻处罚。鉴于被告人刘某认罪悔罪,事发后,其家人代其对被害人的亲属进行了经济赔偿,量刑时亦可酌情从轻处罚并适用缓刑。依照《中华人民共和国刑法》第一百三十三条、第六十七条、第七十二条第一款、第七十三条第二、三款之规定,判决如下:\n被告人刘某犯交通肇事罪,判处有期徒刑一年一个月,缓刑二年。\n(缓刑考验期,自判决确定之日起计算)",
            "诉讼参与人": "公诉机关河北省高碑店市人民检察院。\n被告人刘某,农民。因本案于2014年1月18日被高碑店市公安局刑事拘留,同年1月26日被该局监视居住,7月26日被取保候审。",
            "诉请": "公诉机关指控,2013年12月31日7时40分许,被告人刘某驾驶车牌为冀F×××××号的银灰色捷达轿车,沿老112国道由北向南行驶至高碑店市高静园公墓路口处时,与由西向北转弯上公路的骑行电动自行车的被害人王某相撞,致使王某受伤经抢救无效死亡,两车不同程度损坏。事故发生后,刘某拨打了120急救电话和122报警电话,现场等候交警人员处理事故。经法医鉴定,王某符合交通事故致颅脑损伤合并失血性休克死亡。经高碑店市公安交通警察大队认定,被告人刘某负此事故的主要责任,王某负此事故的次要责任。"
        }
    }
}