预训练模型(平台预置模型)

预训练模型是平台提供的预置模型,可直接通过API接口进行调用。

2023年3月24日,NLP自学习平台-预训练模型按照行业类型进行分类升级,全面迁移至NLP自然语言处理,模型调用方式和接口由NLP自学习平台提供,API接口参考文档如下。

服务调用

模型调用文档参考:模型调用

SDK示例文档参考:SDK示例

API接口列表

电商行业能力

模型名称

模型说明

默认QPS

最大文本长度

商品评价解析-电商领域

支持55种电商领域的行业和192个评价属性,提供多维度商品评价文本分析。

10

500个字符

商品评价解析-本地生活

支持美容美发美甲、餐饮美食2种本地生活领域的行业和11个评价属性,提供多维度商品评价文本分析。

10

500个字符

商品评价解析-汽车领域

支持汽车领域68个评价属性,提供多维度商品评价文本分析。

10

500个字符

商品评价购买决策分析-电商领域

适用于分析用户的购买动机、使用场景、功能需求、使用疑问等购买决策相关的信息,可以帮助改进产品、改善用户体验、细分人群画像、针对性营销投放等。

10

500个字符

商品评价购买决策分析-汽车领域

适用于分析用户的购买动机、使用场景、功能需求、使用疑问等购买决策相关的信息,可以帮助改进产品、改善用户体验、细分人群画像、针对性营销投放等。

10

500个字符

在线客服场景解析

支持电商等行业的客服在线聊天场景,解析消费者说话内容,得到消费者意图、情感、情绪等结果。

10

/

对话知识抽取

适用于客服在线聊天场景,从对话中抽取出客服话术和用户问题,用于热点问题分析或构建客服话术库。

10

/

商品文案生成(中文)

适用于:给定商品和一些卖点词,生成和卖点相关的商品文案描述。

10

/

通用行业能力

模型名称

模型说明

默认QPS

最大文本长度

招中标公告类型分类服务

支持对招中标公告进行分类,目前支持“招标”、“中标”两种类型。

10

/

招标中标信息抽取-基础版服务

支持招中标信息里关于项目名称、项目编号、招标人名称、中标金额等13个字段的抽取。

10

/

招标信息抽取-高级版

支持招标、中标单独解析,对招标信息抽取22个字段。

10

/

中标信息抽取-高级版

支持招标、中标单独解析,对中标信息抽取29个字段。

10

/

合同要素抽取-通用领域

支持合同中的常见要素进行抽取,共支持26个通用要素字段。

10

/

文档结构化-KV信息抽取

适用于从文档中抽取符合key : value模式的信息,支持简历、合同、报告等文档。

10

/

电销场景对话-行业分类

适用于电话销售外呼场景,针对对话应用按照行业和场景进行分类,可应用于语音质检。支持30+个行业和170+个场景。

10

/

脏话识别服务

支持电销场景对话客服质检、直播场景主播监管等应用场景。

10

/

电销场景对话-用户意图识别

适用于电销人工外呼/智能外呼场景,识别用户的意图(反应)。

10

/

电销场景对话-疑似诈骗识别

适用于电话销售外呼场景,识别有诈骗风险的对话,可应用于语音质检。

10

/

简历抽取-英文

支持姓名、联系方式、学位、公司、职位等10个简历字段抽取,适用于英文简历。

10

/

简历抽取-中文

支持姓名、性别、年龄、学历、工作单位等33个简历字段抽取,适用于中文简历。

10

/

事件抽取(英文)

支持对英文新闻里事件的抽取,包含33个事件类别。

10

/

商品标题类目预测

支持电商场景的商品标题,预测所属的类目,类目体系和淘宝等电商平台的一致。

10

/

小说涉黄识别服务

支持中文小说涉黄/色情内容识别,适用于小说内容监管场景。输出涉黄的置信度和相关文本内容。

10

600个字符

情感分析(俄语)

适用于针对电商场景的社交媒体(短文本),预测俄语文本所表达的情感,分为正,中,负,三种情感。

10

/

情感分析(英语)

适用于针对电商场景的社交媒体(短文本),预测英语文本所表达的情感,分为正,中,负,三种情感。

10

/

情感分析(西班牙语)

适用于针对电商场景的社交媒体(短文本),预测西班牙语文本所表达的情感,分为正,中,负,三种情感。

10

/

情绪识别服务

支持电销、在线接待等应用场景,识别客户或客服的情绪,支持8种常规情绪和3种业务场景常用情绪。

10

1000个字符

新闻文本分类

支持对单个或多个新闻文本的分类。

10

/

直播ASR乱码识别

适用于直播场景,通过ASR语音转文字,识别由于多人同时说话导致的文字可读性不佳的问题。

10

600个字符

裁判文书抽取

支持10个案由的文书,解析得到38个字段。

10

/

关键词抽取和文本摘要(抽取式)

适用于针对文档抽取关键词或者摘要。

10

500个字符

文本摘要(生成式)

针对实际场景中常见的文本生成需求所设计,适用于生成文本摘要或者生成文章的标题。:

10

500个字符

天气播报欢迎语生成(中文)

适用于:给定一些天气信息字段,生成车载开机欢迎语生成介绍。

10

500个字符

文本向量生成

支持中文文本输入,输出文本对应的向量表示。

10

/

反讽识别

适用于识别社会媒体中反语和讽刺的修辞手法。

10

/

幽默分类

通过分析幽默的内容,预测不同幽默的类型(谐音、协议、反转)。

10

/