NLP自学习平台功能发布记录。
2023年02月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
实体抽取 | 自学习模型 | 新增UIE小样本实体抽取模型。 | 2023-02-16 | |
关系抽取 | 自学习模型 | 新增UIE小样本关系抽取模型。 | 2023-02-16 | |
文本分类 | 自学习模型 | 新增StructBERT小样本分类。 | 2023-02-10 |
2022年09月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
关系抽取 | 自学习模型 | 新增StrcutBERT-split模型。 | 2022-09-01 | |
关系抽取 | 自学习模型 | 新增StrcutBERT-cascade模型。 | 2022-09-01 | |
文本摘要(生成式) | 预训练模型 | 基于PALM2.0的生成式摘要模型,适用于生成摘要或者文章标题。 | 2022-09-07 | |
商品文案生成(中文) | 预训练模型 | 给定商品和一些卖点词,生成和卖点相关的商品文案描述。 | 2022-09-20 | |
天气播报欢迎语生成(中文) | 预训练模型 | 给定一些天气信息字段,生成车载开机欢迎语生成介绍。 | 2022-09-28 |
2022年07月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
合同抽取 | 自学习模型 | 抽取合同文本中的实体,内置20+个无需标注的实体标签,模型训练的数据标注成本低至原本的20%以下。 | 2022-07-08 | |
司法裁判文书(事实认定) | 自学习模型 | 抽取司法裁判文书中事实认定的实体,内置10+个无需标注的实体标签,模型训练的数据标注成本低至原本的50%以下。 | 2022-07-08 |
2022年06月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价解析-增量训练 | 自学习模型 | 支持用户在平台商品评价解析预训练模型(电商领域、汽车领域、本地生活领域)的基础上,自定义需要增加的标签,用户只需要训练增加的标签,即可得到一个完整的解析模型; | 2022-06-17 |
2022年05月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
电销场景主被叫意图识别 | 预训练模型 | 适用于电话销售外呼场景,针对对话内容,识别主叫意图(营销、通知、催收等)和被叫意图(不方便、情感倾向、交流意愿等),可应用于语音质检。 | 2022-05-06 | |
实体抽取 | 规则引擎升级 | 模型发布后支持新增、修改规则,无需重新训练模型。 | 2022-05-06 |
2022年03月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
实体抽取 | 自学习模型 | StructBert系列模型推理加速,平均rt下降45%。平均长度2k字时,平均rt约3s。 | 2022-03-14 | |
文本分类 | 自学习模型 | 新增StructBet实现。 | 2022-03-18 | |
对话分类 | 自学习模型 | 新增高精度版(StructBet实现)。 | 2022-03-18 |
2021年12月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价购买决策分析-汽车领域 | 预训练模型 | 用于分析用户的购买动机、使用场景、功能需求、使用疑问等购买决策相关的信息,可以帮助改进产品、改善用户体验、细分人群画像、针对性营销投放等,包含25种标签。 | 2021-12-09 | |
商品评价解析服务-汽车领域 | 预训练模型 | 适用于汽车领域的评价解析服务,包含71种属性标签。详见右侧文档。 | 2021-12-09 | |
实体抽取 | 自学习模型 | 新增中文StructBert-CRF模型,适用于标签之间依赖较强的数据集。 | 2021-12-03 |
2021年11月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价购买决策分析-电商领域 | 预训练模型 | 用于分析用户的购买动机、使用场景、功能需求、使用疑问等购买决策相关的信息,可以帮助改进产品、改善用户体验、细分人群画像、针对性营销投放等。 | 2021-11-24 | |
实体抽取 | 自学习模型 | 新增中文StructBert: 基于阿里自研的Struct BERT,从大量无标注语料进行预训练的模型并且蒸馏后的模型,适合标注语料不足的中文任务。针对实体重叠问题进行了优化。 | 2021-11-19 | |
我的模型页 | 控制台迭代更新 | 新增【我的模型】页面:支持查询已发布的自学习模型和调用预训练模型,支持查看已购模型数量、剩余资源包余额显示、延长模型有效期、变配模型个数。 | 2021-11-19 | / |
2021年10月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价解析-电商领域 | 预训练模型升级 | 新增6个行业:汽车用品、节庆用品、3C数码配件、五金工具、宠物、鲜花绿植等,更新6个已有行业(增加属性类别)。详见右侧文档 | 2021-10-19 | |
对话分类 | 自学习模型 | 对整个对话文本按照内容类型进行分类,典型应用场景:对话质检、客户意图识别、电销线索挖掘等。详见右侧文档 | 2021-10-12 |
2021年9月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
文档结构化-KV信息抽取 | 预训练模型 | 适用于从文档中抽取符合key : value模式的信息,典型应用场景如简历文档、合同文档、报告文档等,对具备显著KV信息模式的文档抽取效果较好。详见右侧文档 | 2021-09-23 | |
合同要素抽取-通用领域 | 预训练模型 | 针对合同中的常见要素进行抽取,共支持26个通用要素字段。详见右侧文档 | 2021-09-07 | |
合同要素抽取 | 自学习模型 | 针对合同抽取场景(甲方、乙方、时间等)定制开发,抽取合同中具有特定意义或者关键的要素。详见右侧文档 | 2021-09-01 |
2021年8月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
招标中标信息抽取-高级版 | 预训练模型升级 | 中标模型新增招标代理机构、项目负责人信息等7个字段,当前共支持抽取36个字段。详见右侧文档 | 2021-08-01 | |
商品评价解析-电商领域 | 预训练模型升级 | 新增:影音电器、厨房电器、厨房/烹饪用具3个行业,7个行业属性类别有增加。详见右侧文档 | 2021-08-05 |
2021年7月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价解析-高精度版 | 自学习模型 | 基于Bert实现,训练和预测速度较慢,精度较高。计算资源要求较低,适合训练数据量较大的情况。详见右侧文档 | 2021-07-07 | |
商品评价解析-电商领域 | 预训练模型升级 | 新增:清洁工具、个人护理、家居饰品、居家日用、居家布艺、孕产妇用品、收纳整理、餐饮具、玩具9个行业,6个行业属性类别有增加。详见右侧文档 | 2021-07-12 | |
双句文本分类 | 自学习模型 | 对两句文本按照内容进行分类,同时支持单标签和多标签,包含高精度版和高性能版。典型应用场景:计算两句话是否语义相等、计算问句和回答是否匹配、考虑上下文的单句分类等。详见右侧文档 | 2021-07-16 | |
标注功能升级 | 前端体验优化 | 新增前一条后一条等按钮、支持标注过程中修改题目、更清晰的交互、更直观的数据展示、其他体验优化等 | 2021-07-28 | / |
2021年6月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
招标中标类型分类服务 | 预训练模型 | 适用于作为招标解析服务(高级版)、中标解析服务(高级版)的前处理步骤,区分公告类型。详见右侧文档 | 2021-06-08 | |
招标中标信息抽取-高级版服务 | 预训练模型 | 高级版对比基础版,支持更多字段,更高精度。详见右侧文档 | 2021-06-08 |
2021年5月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价解析-电商领域 | 预训练模型升级 | 新增:母婴类、图书、服饰类-服饰配件、户外、运动、文具、洗护清洁7个行业,20个行业属性类别有增加。详见右侧文档 | 2021-05-20 | |
预置数据集 | 体验优化 | 为文本分类、实体抽取、短文本匹配、关系抽取等自学习算法模块预置测试数据集,帮助用户快速上手。 | 2021-05-24 | / |
实体抽取 | 自学习模型升级 | 规则引擎升级,支持规则组合、与或关系、支持和模型抽取结果结合的复杂表示;支持规则效果预览;效率远高于旧版本。详见右侧文档。 | 2021-05-24 |
2021年4月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
情绪识别服务 | 预训练模型升级 | 新增高精度版,详见右侧文档 | 2021-04-12 |
2021年3月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
电销场景对话疑似诈骗识别 | 预训练模型 | 适用于电话销售外呼场景,针对对话内容,识别疑似诈骗风险,可应用于语音质检。详见右侧文档 | 2021-03-30 | |
商品评价解析服务-本地生活领域 | 预训练模型 | 适用于本地生活领域的评价解析服务,当前支持美容美发美甲行业、餐饮美食行业。详见右侧文档 | 2021-03-29 | |
情绪识别服务 | 预训练模型升级 | 优化了正面情绪的识别效果,新增三种业务常用情绪(投诉、感谢、抱怨),详见右侧文档 | 2021-03-25 | |
电销场景对话风险识别 | 预训练模型 | 适用于电话销售外呼场景,针对对话内容,识别风险(辱骂、投诉、威胁等),可应用于语音质检。详见右侧文档 | 2021-03-24 | |
招标文书解析 | 自学习模型 | 上线场景行业算法-招标文书解析模型,支持平台模型测试、定制用户模型。 | 2021-03-24 | |
实体抽取 | 前端体验优化 | 支持Excel方式批量上传待标注数据 | 2021-03-04 | / |
文本分类 | 前端体验优化 | 标注过程中支持修改题目;支持通过文件上传题目;优化多标签数据集统计结果展示效果 | 2021-03-04 | / |
2021年2月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价解析-电商领域 | 预训练模型升级 | 新增行业code=’all’,返回全行业标签,支持客户按照需求筛选。详见右侧文档 | 2021-02-19 | |
文本分类 | 预训练模型 | 测试界面支持上传文件批量预测 | 2021-01-31 | / |
所有 | 前端体验优化 | 训练阶段,可删除指定版本模型、取消发布等 | 2021-02-01 | / |
2021年1月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
实体抽取 | 自学习模型升级 | 返回结果增加conf,表示抽取的实体置信度 | 2021-01-20 | / |
关键词抽取和文本摘要 | 预训练模型 | 基于textrank算法,适用于针对文档抽取关键词或者摘要。详见右侧文档 | 2021-01-25 | |
电销场景对话行业分类 | 预训练模型 | 适用于电话销售外呼场景,针对对话应用按照行业和场景进行分类,可应用于语音质检。详见右侧文档 | 2021-01-31 | |
所有 | 前端体验优化 | 默认采用上传文件名作为数据集名称、显著显示所有模型版本按钮、模型指标页面支持排序等 | 2021-01-31 | / |
2020年11月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价解析 | 预训练模型升级 | 优化服饰、箱包行业,抽取召回率提高25%左右;负面情感的micro-F1 +10%;针对长评价进行了优化;增加归一化属性情感词抽取的能力。详见右侧文档 | 2020-11-09 |
2020年10月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
招标中标信息抽取服务 | 预训练模型 | 针对招标、中标文件,解析关键要素,详见右侧文档 | 2020-10-20 | |
客户咨询解析服务 | 预训练模型 | 适用于针对电商等行业的客服-消费者在线聊天场景,解析消费者说话内容,得到消费者意图、情感、情绪、关注点、细粒度情感等结果。详见右侧文档 | 2020-10-23 | |
对话知识抽取服务 | 预训练模型 | 适用于客服-消费者在线聊天场景,从对话内容中抽取出客服问-客户答、客户问-客服答等客服话术和用户问题,可用于后续的用户热点问题分析或构建客服话术库,优化客服机器人。详见右侧文档 | 2020-10-30 |
2020年9月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品标题类目预测服务 | 预训练模型 | 针对商品标题,预测所属的类目,详见右侧文档 | 2020-09-18 | |
电销场景用户意图识别服务 | 预训练模型 | 针对电话销售场景,识别用户回复客服内容的意图,详见右侧文档 | 2020-09-18 | |
直播ASR乱码识别服务 | 预训练模型 | 适用于直播场景,通过ASR语音转文字,识别由于多人同时说话导致的文字可读性不佳的问题,详见右侧文档 | 2020-09-29 | |
小说涉黄识别服务 | 预训练模型 | 针对中文小说内容,识别是否包含涉黄/色情内容,适用于小说内容监管场景,详见右侧文档 | 2020-09-29 | |
情感分析(英语)服务 | 预训练模型 | 适用于针对电商场景的社交媒体(短文本),预测文本所表达的情感,详见右侧文档 | 2020-09-30 | |
情感分析(西班牙语)服务 | 预训练模型 | 适用于针对电商场景的社交媒体(短文本),预测文本所表达的情感,详见右侧文档 | 2020-09-30 | |
情感分析(俄语)服务 | 预训练模型 | 适用于针对电商场景的社交媒体(短文本),预测文本所表达的情感,详见右侧文档 | 2020-09-30 | |
文本向量生成服务 | 预训练模型 | 适用于中文,详见右侧文档 | 2020-09-30 |
2020年8月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
实体抽取 | 预测服务框架升级 | 实体抽取的模型预测服务框架升级,模型预测效率提升2倍以上(仅对新训练的模型生效) | 2020-08-18 | / |
文本分类/实体抽取 | 智能标注模块上线 | 目前支持文本分类和实体抽取任务的智能标注,可以通过平台提供的预标注和主动学习能力进行智能标注,减少标注所需工作量,提高工作效率和标注质量,并将数据用于模型的训练。 | 2020-08-13 | / |
脏话识别服务 | 预训练模型 | 针对一句话识别是否是脏话,以及抽取脏话关键词,详见右侧文档 | 2020-08-26 | |
情绪识别服务 | 预训练模型 | 针对一句话识别情绪,当前支持8种情绪识别,详见右侧文档 | 2020-08-26 | |
新闻层次分类服务 | 预训练模型 | 针对新闻数据识别新闻类型,详见右侧文档 | 2020-08-26 | |
商品评价解析 | 预训练模型升级 | 新增电器类-扫地机器人、快消品-洗护两个行业,支持行业从37个增加到39个;模型架构升级,重点优化了属性观点词抽取,准确率提升15%。详见右侧文档 | 2020-08-27 |
2020年7月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
所有 | Word格式文档解析优化 | 上传待标注文档中的Word格式文档解析优化,解析句子更加完整 | 2020-07-16 | / |
判决文书解析 | 预训练模型 | 可直接调用的裁判文书解析预训练模型服务,详见右侧相关文档 | 2020-07-09 |
2020年6月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
实体抽取/简历抽取 | 支持增量训练 | 实体抽取与简历抽取模型支持增量训练,模型迭代更高效快捷 | 2020-06-18 | / |
所有 | 文档解析与模型发布时间预估 | 上传待标注文档/上传已标注数据集/点击模型发布后,平台给出时间预估,完成后发送短信与邮件通知 | 2020-06-12 | / |
2020年5月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
商品评价解析 | 预训练模型升级 | 可直接调用的商品评价解析预训练模型服务升级,支持属性情感识别、属性情感词抽取、情感子句抽取、整句情感识别4个功能,同时由基础版本的24个行业增加到37个,详见右侧相关文档 | 2020-05-30 | |
简历抽取 | 1.0版本上线 | 新上线项目类型,基于阿里内部海量已标注数据训练的模型和规则引擎,实现高准确率的中英文简历抽取,平台提供姓名、手机号、电子邮箱、工作经历、教育经历等27个中文常见字段和10个英文常见字段。若有其他自定义字段,可自行补充标注数据,定制训练。当仅选择平台提供的简历抽取字段时,无需标注数据 | 2020-05-15 | / |
2020年4月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
简历抽取 | 预训练模型 | 可直接调用的中英文简历抽取预训练模型服务,详见右侧相关文档 | 2020-04-30 | - 中文服务:简历抽取(中文)服务使用教程- 英文服务:简历抽取(英文)服务使用教程 |
商品评价解析 | 预训练模型 | 可直接调用的商品评价解析预训练模型服务,详见右侧相关文档 | 2020-04-17 | |
实体抽取 | 手机号抽取模块 | 创建模型的高级参数中,增加平台预置的手机号抽取选项 | 2020-04-03 | / |
2020年3月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
智能合同审查 | 1.0版本上线 | 新上线项目类型,对合同里存在的风险点进行智能审查,包括合同逻辑错误、条款缺失、要素不一致、司法风险等;并对合同的相对方资质进行审查,包括多维度潜在风险、风险评级、相对方基本信息等 | 2020-03-06 | / |
2020年2月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
实体抽取/文本分类/商品评价解析 | 模型训练时间预估 | 模型训练时,给出预估训练时间,训练完毕后发送短信与邮件通知 | 2020-02-28 | / |
2020年1月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
实体抽取 | 上线实体抽取bert模型 | bert模型适合小样本数据集,详见右侧相关文档 | 2020-01-23 | |
文本分类 | 超大类别个数的模型优化 | 优化了超大类别个数的模型训练时间较长的问题 | 2020-01-23 | / |
实体抽取/文本分类/情感分析/商品评价解析 | 数据预处理 | 平台预置若干预处理规则,协助规整数据,详见右侧相关文档 | 2020-01-17 | |
短文本匹配 | 1.0版本上线 | 新上线项目类型,上传短文本匹配数据,训练短文本语义匹配模型,使用模型时,输入两个短文本,返回相似度 | 2020-01-17 | / |
2019年12月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
所有 | 新增异步预测接口 | 该接口支持更长文本与文件的离线调用,支持字数:10000字;支持文件格式:txt、html、pdf、doc、docx,详见右侧相关文档 | 2019-12-31 | |
商品评价解析 | 1.0版本上线 | 新上线项目类型,基于阿里电商平台海量已标注数据,建立各行业定制模型,多维度分析商品评价文本。当仅选择平台提供的评价维度时,无需标注数据 | 2019-12-20 | / |
所有 | 模型包月规格增加 | 增加多月模型包月规格,详见右侧相关文档 | 2019-12-20 | |
实体抽取 | 上线规则引擎 | 对部分用户免费开放规则引擎内测权限,通过配置规则辅助模型,详见右侧相关文档 | 2020-12-13 |
2019年11月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
文本分类 | 模型迭代优化 | 更新优化了6种文本分类模型,详见右侧相关文档 | 2019-11-01 | |
关系抽取 | 模型迭代优化 | 关系抽取模型优化,本次更新集成了实体抽取,模型训练完成后可同时抽取实体与关系 | 2019-11-01 | / |
2019年10月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
所有 | 支持RAM子账号授权 | 通过RAM对子账号进行授权管理,详见右侧相关文档 | 2019-10-25 | |
文本分类 | 上线文本分类bert模型 | bert模型适合小样本数据集,详见右侧相关文档 | 2019-01-23 |
2019年9月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
所有 | 云栖大会发布会 | 云栖大会发布NLP自学习平台,详见右侧相关文档 | 2019-09-26 | |
所有 | 正式商业化 | 公布公有云收费方案,正式商业化,详见右侧相关文档 | 2019-09-23 | |
关系抽取 | 1.0版本上线 | 新上线项目类型,抽取文本中的实体及对应的关系 | 2019-09-20 | / |
情感分析 | 1.0版本上线 | 新上线项目类型,分析并给出文本的情感正负倾向 | 2019-09-20 | / |
关键短语抽取 | 1.0版本上线 | 新上线项目类型,抽取文本中的关键词及短语标签 | 2019-09-20 | / |
实体抽取 | 标注功能优化 | 标注页面新增同值标注与偏移量微调功能,详见右侧相关文档 | 2019-09-06 |
2019年8月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
所有 | 数据中心优化 | 支持查看数据分布,上传数据集支持质检,模型数据纠错回流,增加提交标注需求的入口 | 2019-08-30 | / |
文本分类 | 模型版本迭代 | 多分类模型进行了优化提升训练速度和预测效率 | 2019-08-30 | / |
2019年7月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
所有 | 教学视频发布 | 发布教学视频,帮助用户快速了解平台使用流程,详见右侧相关文档 | 2019-07-19 |
2019年6月
项目类型 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
所有 | 自学习平台1.0版本上线 | 自学习平台公测,支持实体抽取与文本分类算法的自定义定制 | 2019-06-10 | |
所有 | 模型中心优化 | 增加模型版本管理模块,详见右侧相关文档 | 2019-06-05 | |
实体抽取 | 1.0版本上线 | 新上线项目类型,抽取文本中具有特定意义的实体 | 2019-06-01 | / |
文本分类 | 1.0版本上线 | 新上线项目类型,抽取文本中的关键词及短语标签 | 2019-06-01 | / |