前言
2020年12月31日NLP基础服务正式商业化。2023年3月,NLP基础服务全面升级为NLP自然语言处理。
相对NLP基础服务1.0、2.0,NLP自然语言处理主要有如下内容更新:
NLP自然语言处理调整为5大分类,基础文本服务、电商行业能力、对话智能服务、通用行业能力、医疗行业能力。
原NLP自学习平台预训练模型调整到电商行业能力、通用行业能力中,帮助用户快速通过API调用对应行业服务能力。
全新的管控台界面交互,更好的管理已创建服务,单击访问管控台。
升级定价方案,每个用户将拥有更多的免费调用额度。
产品调用:请参考入门介绍进行调用。
一、基础文本服务
1.1基础版
算法服务  | 支持领域  | API基础信息  | 免费额度  | 默认QPS  | 最大文本长度  | 
中文分词  | 通用  | 50万次/天  | 20  | 1024个字符  | |
词性标注  | 通用  | 50万次/天  | 20  | 1024个字符  | |
命名实体识别  | 电商  | 50万次/天  | 20  | 1024个字符  | |
情感分析  | 通用  | 50万次/天  | 20  | 1000个字符  | |
中心词提取  | 中文电商  | 50万次/天  | 20  | 128个字符  | |
英文电商  | 50万次/天  | 20  | 40个字符  | ||
智能文本分类  | 新闻  | 50万次/天  | 20  | 5000个字符  | |
电商  | 50万次/天  | 20  | 5000个字符  | ||
词向量  | 通用  | 50万次/天  | 20  | 1024个字符  | 
1.2高级版
算法服务  | 支持领域  | API基础信息  | 免费额度  | 默认QPS  | 最大文本长度  | 
多语言分词  | 通用  | 累计50万次  | 20  | 1024个字符  | |
电商标题  | 累计50万次  | 20  | 1024个字符  | ||
电商内容  | 累计50万次  | 20  | 1024个字符  | ||
电商评价  | 累计50万次  | 20  | 1024个字符  | ||
文娱  | 累计50万次  | 20  | 1024个字符  | ||
O2O  | 累计50万次  | 20  | 1024个字符  | ||
东南亚语种通用  | 累计50万次  | 20  | 1024个字符  | ||
东南亚语种电商  | 累计50万次  | 20  | 1024个字符  | ||
命名实体识别  | 电商  | 累计50万次  | 20  | 中文:1024个字符 多语言:500个字符  | |
东南亚语种电商  | 累计50万次  | 20  | 中文:1024个字符 多语言:500个字符  | ||
词性标注  | 电商  | 累计50万次  | 20  | 1024个字符  | |
词向量  | 电商  | 累计50万次  | 20  | 1024个字符  | |
评论  | 累计50万次  | 20  | 1024个字符  | ||
搜索  | 累计50万次  | 20  | 1024个字符  | ||
文娱  | 累计50万次  | 20  | 1024个字符  | ||
情感分析  | 东南亚语种电商  | 累计50万次  | 20  | 500个字符  | |
文本纠错  | 英文通用  | 累计50万次  | 20  | 英文:512个字符  | |
中文通用  | 累计50万次  | 20  | 中文:128个字符 英文:500个字符  | ||
文本摘要  | 电商  | 累计50万次  | 20  | 最小长度不小于60字,最大长度不超过800字  | |
文本相似度  | 电商  | 累计50万次  | 20  | 512个字符  | |
依存句法分析  | 电商  | 累计50万次  | 20  | 120个字符  | |
通用(CTB标签)  | 累计50万次  | 20  | 120个字符  | ||
通用(Stanford标签)  | 累计50万次  | 20  | 120个字符  | ||
表格问答  | 通用  | 公测期间免费  | 10  | 120个字符  | 
二、电商行业能力
算法服务  | 支持领域  | API基础信息  | 免费额度  | 默认QPS  | 最大文本长度  | 
智能商品发布  | 类目预测  | 累计500次  | 20  | 800个字符  | |
价格抽取  | 累计500次  | 20  | 800个字符  | ||
品牌预测  | 累计500次  | 20  | 800个字符  | ||
商品评价解析  | 电商领域  | 与通用行业能力共计500次  | 10  | 500个字符  | |
本地生活  | 10  | 500个字符  | |||
汽车领域  | 10  | 500个字符  | |||
商品评价购买决策分析  | 电商领域  | 10  | 500个字符  | ||
汽车领域  | 10  | 500个字符  | |||
电商客服  | 在线客服  | 10  | /  | ||
在线客服  | 10  | /  | |||
其他电商能力  | 电商领域  | 10  | 500个字符  | 
三、对话智能服务
算法服务  | 支持领域  | API基础信息  | 免费额度  | 默认QPS  | 最大文本长度  | 
表格问答  | 通用  | 公测期间免费  | 10  | /  | 
四、通用行业能力
模型名称  | 模型说明  | 免费额度  | 默认QPS  | 最大文本长度  | 
支持对招中标公告进行分类,目前支持“招标”、“中标”两种类型。  | 共计 500次  | 10  | /  | |
支持招中标信息里关于项目名称、项目编号、招标人名称、中标金额等13个字段的抽取。  | 10  | /  | ||
支持招标、中标单独解析,对招标信息抽取22个字段。  | 10  | /  | ||
支持招标、中标单独解析,对中标信息抽取29个字段。  | 10  | /  | ||
支持合同中的常见要素进行抽取,共支持26个通用要素字段。  | 10  | /  | ||
适用于从文档中抽取符合key : value模式的信息,支持简历、合同、报告等文档。  | 10  | /  | ||
适用于电话销售外呼场景,针对对话应用按照行业和场景进行分类,可应用于语音质检。支持30+个行业和170+个场景。  | 10  | /  | ||
支持电销场景对话客服质检、直播场景主播监管等应用场景。  | 10  | /  | ||
适用于电销人工外呼/智能外呼场景,识别用户的意图(反应)。  | 10  | /  | ||
适用于电话销售外呼场景,识别有诈骗风险的对话,可应用于语音质检。  | 10  | /  | ||
支持姓名、联系方式、学位、公司、职位等10个简历字段抽取,适用于英文简历。  | 10  | /  | ||
支持姓名、性别、年龄、学历、工作单位等33个简历字段抽取,适用于中文简历。  | 10  | /  | ||
支持对英文新闻里事件的抽取,包含33个事件类别。  | 10  | /  | ||
支持电商场景的商品标题,预测所属的类目,类目体系和淘宝等电商平台的一致。  | 10  | /  | ||
支持中文小说涉黄/色情内容识别,适用于小说内容监管场景。输出涉黄的置信度和相关文本内容。  | 10  | 600个字符  | ||
适用于针对电商场景的社交媒体(短文本),预测俄语文本所表达的情感,分为正,中,负,三种情感。  | 10  | /  | ||
适用于针对电商场景的社交媒体(短文本),预测英语文本所表达的情感,分为正,中,负,三种情感。  | 10  | /  | ||
适用于针对电商场景的社交媒体(短文本),预测西班牙语文本所表达的情感,分为正,中,负,三种情感。  | 10  | /  | ||
支持电销、在线接待等应用场景,识别客户或客服的情绪,支持8种常规情绪和3种业务场景常用情绪。  | 10  | 1000个字符  | ||
支持对单个或多个新闻文本的分类。  | 10  | /  | ||
适用于直播场景,通过ASR语音转文字,识别由于多人同时说话导致的文字可读性不佳的问题。  | 10  | 600个字符  | ||
支持10个案由的文书,解析得到38个字段。  | 10  | /  | ||
适用于针对文档抽取关键词或者摘要。  | 10  | 500个字符  | ||
针对实际场景中常见的文本生成需求所设计,适用于生成文本摘要或者生成文章的标题。  | 10  | 500个字符  | ||
适用于:给定一些天气信息字段,生成车载开机欢迎语介绍。  | 10  | 500个字符  | ||
支持中文文本输入,输出文本对应的向量表示。  | 10  | /  | ||
适用于识别社会媒体中反语和讽刺的修辞手法。  | 10  | /  | ||
通过分析幽默的内容,预测不同幽默的类型(谐音、协议、反转)。  | 10  | /  | 
五、医疗行业能力
算法服务  | 支持领域  | API基础信息  | 免费额度  | 默认QPS  | 最大文本长度  | 
医疗文本分析  | 诊断归一  | 累计500次  | 20  | 50个字符  | |
药品归一  | 累计500次  | 20  | /  | ||
手术归一  | 累计500次  | 20  | 50个字符  | ||
病历查重  | 累计500次  | 20  | /  | ||
医学实体识别  | 累计500次  | 20  | 256个字符  | ||
医学文本相似度  | 累计500次  | 20  | 32个字符  |