更新时间:2020-08-28 16:18
欢迎使用自然语言处理服务,这里主要为您介绍如何使用NLP自学习平台,以及如何快速找到需要的帮助信息。
NLP自学习平台平台于2019年9月23日开始正式收费,每位主账号新用户均有1个月的免费试用期,详细定价方案请见NLP自学习平台定价。如需提高QPS或是其他任何问题,欢迎加入“阿里云NLP自学习平台用户答疑群”(钉钉群号:23142693)
您需要先开通自然语言服务才能使用NLP自学习平台,开通服务步骤请见NLP基础服务快速入门。
NLP自学习平台的基本使用流程如下图所示,全程可交互操作,无需工程与算法背景,预计500份以上的标注数据时,模型准确率可以达到85%以上。
创建并管理自己的项目,目前您可以创建八种项目类型:1、文本实体抽取;2、文本分类;3、关键短语抽取;4、情感分析;5、关系抽取;6、短文本匹配;7、商品评价解析;8、简历抽取
正在补充增加更多的项目类型中,敬请期待。
注意:项目可添加更多的项目管理员,管理员拥有这个项目下所有权限(项目、数据、模型等),通过输入阿里云账号添加;同时,也支持子账号管理项目,详见子账号授权相关问题
进入某一项目后,可以在数据中心中管理您的数据,有两种方式可以创建数据:1、创建标注任务;2、上传数据集。
步骤一:上传待标注文档,添加标注人员
注意:创建者和项目管理员默认为标注人员,同时,您也可以将标注任务分配给您创建的阿里云子账号,被分配用户通过子账号的账号密码登录本平台,即可参与数据标注。子账号登录说明:1、子账号登录页,登录:https://signin.aliyun.com/login.htm2、登录后,复制该URL进入标注页面:https://nlp-automl.aliyun.com/automl/annotation/index
步骤二:设置待标注的题目
不同项目类型中的题目类型会有所不同,例如
文本实体抽取项目中的题目为实体名:文本分类项目中的题目为分类名:
步骤三:标注数据
完成标注任务的创建后,您可以在数据中心中,点击标注进入标注中心,进行文档的标注,每篇文档仅会被标注一次
步骤四:数据质检(可选)
您可以通过筛选和搜索,质检已经标注好的文档,以确保良好的标注质量
除了创建标注任务外,您也可以上传本地已标注好的训练数据,按示例文件的格式规整后,直接上传
用户可以在模型中心中一键训练模型,查看模型评估指标,并进行在线可交互测试,测试完毕后可通过API方式调用接口
步骤一:训练模型
在创建模型页中,输入模型基本信息,选择已标注完的数据,一键训练模型,模型训练需0.5-1小时
步骤二:模型查看
您可以查看模型的相关评估指标,主要有精确率、召回率和F1值;同时,您也可以新增模型版本,进行版本管理
注意:如果训练数据在100份以内,模型效果可能欠佳,且评估指标波动较大,基本无参考意义。若需要良好稳定的模型效果,训练数据建议在500份以上
步骤三:模型测试
模型发布后,您可以直接在平台上进行测试,并对不准的预测结果进行纠错
注意:为方便业务使用,同一模型同时可以发布两个版本,若需发布第三个版本,请手动下线一个已发布的版本
步骤四:API调用模型
您可以根据帮助文档,API调用该模型,API调用说明请见NLP自学习平台API
2019年12月31日更新:新增异步预测接口
该接口支持更长文本的离线调用,支持字数:10000字;支持文件格式:txt、html、pdf、doc、docx。使用文档:https://help.aliyun.com/document_detail/148089.html
1.1 实体抽取1.2 文本分类
1.3 关键短语抽取
1.4 情感分析1.5 关系抽取
1.6 短文本匹配
1.7 商品评价解析
1.8 简历抽取
在文档使用中是否遇到以下问题
更多建议
匿名提交