【试用教程】基于NLP自学习平台创建并训练情感分析模型
nlp
一键配置
16
教程简介
教程以情感分析场景为例,提供使用NLP自学习平台创建并测试模型的指引。NLP自学习平台是面向算法初阶用户的自然语言处理应用服务。在您免费试用NLP自学习平台时,产品默认为您提供预置的数据集,方便您快速完成模型的创建与测试。
我能学到什么
学会使用NLP自学习平台的基础功能。
学会如何使用NLP自学习平台搭建自然语言的情感分析模型并对模型进行训练。
操作难度 | 易 |
所需时间 | 16分钟 |
使用的阿里云产品 | |
所需费用 | 0元 |
准备环境及资源
5
开始教程前,请按以下步骤准备环境和资源:
访问阿里云免费试用。单击页面右上方的登录/注册按钮,并根据页面提示完成账号登录(已有阿里云账号)、账号注册(尚无阿里云账号)或实名认证(根据试用产品要求完成个人实名认证或企业实名认证)。
成功登录后,在产品类别下选择AI与机器学习 ,在NLP自学习平台卡片上单击立即试用。
在NLP自学习平台配置面板,完成参数信息配置。
同意协议后,单击立即试用,并根据页面提示完成试用申请。
一键配置
5
准备好资源后,您可以通过一键配置快速完成资源配置或应用搭建。一键配置基于阿里云资源编排服务ROS(Resource Orchestration Service)实现,旨在帮助开发者通过IaC(Infrastructure as Code)的方式体验资源的自动化配置。如需查看软件版本、安装命令等配置的具体信息,可查看教程的手动配置版。模板完成的内容包括:
创建项目
准备数据
创建并训练模型
操作步骤
打开一键配置模板链接前往ROS控制台,系统自动打开使用新资源创建资源栈的页面。
在配置模板参数页面,填写资源栈名称、NLP自学习平台项目名称、NLP自学习平台项目描述、NLP自学习平台项目下数据集名称,然后单击创建。
在资源栈信息页签,当状态显示为创建成功时,表示一键配置完成。
完成
5
完成以上操作后,您已经成功创建模型,并完成模型的训练。
您还需进行以下操作:
测试模型。
详细操作,请参见手动配置版教程中的测试模型页签。
查看测试结果。
您可在模型测试页面,随时查看测试结果。
清理及后续
1
清理
本教程不涉及相关资源的占用,因此无需清理。
其他注意事项:
本教程使用的NLP自学习平台免费试用版提供3个免费模型供您使用,免费试用周期为一个月。
如果您已创建了3个模型,需要创建更多模型时,您需要删除已有的模型,释放模型的免费额度。
免费试用结束后,您的模型和数据会被暂时冻结,无法使用。购买模型后才可重新启用。
后续
无
总结
常用知识点
问题1:待标注文件中建议至少多少条数据再进行训练?(单选题)
正确答案是100,理想状态下建议500条。标注数据过少,会导致训练结果指标偏低。
问题2:标注数据时,标注人员是否可以设置为RAM用户?(单选题)
正确答案是可以。您可以将标注任务分配给您创建的阿里云子账号(即RAM用户)。被分配用户通过该RAM用户登录NLP自然语言处理控制台,即可参与数据标注。
延伸阅读
手动配置
32
教程简介
教程以情感分析场景为例,提供使用NLP自学习平台创建并测试模型的指引。NLP自学习平台是面向算法初阶用户的自然语言处理应用服务。在您免费试用NLP自学习平台时,产品默认为您提供预置的数据集,方便您快速完成模型的创建与测试。
我能学到什么
学会使用NLP自学习平台的基础功能。
学会如何使用NLP自学习平台搭建自然语言的情感分析模型并对模型进行训练。
操作难度 | 易 |
所需时间 | 32分钟 |
使用的阿里云产品 | |
所需费用 | 0元 |
准备环境及资源
5
开始教程前,请按以下步骤准备环境和资源:
访问阿里云免费试用。单击页面右上方的登录/注册按钮,并根据页面提示完成账号登录(已有阿里云账号)、账号注册(尚无阿里云账号)或实名认证(根据试用产品要求完成个人实名认证或企业实名认证)。
成功登录后,在产品类别下选择AI与机器学习 ,在NLP自学习平台卡片上单击立即试用。
在NLP自学习平台配置面板,完成参数信息配置。
同意协议后,单击立即试用,并根据页面提示完成试用申请。
创建项目
3
在NLP自学习平台控制台,单击创建项目。
在创建项目页面的选择项目类型配置向导中,选中情感分析卡片并单击创建。
在创建项目页面的填写项目信息配置向导中,填写该项目的基本信息。
单击确认,完成创建项目。
项目创建完成后,NLP自学习平台会为您自动生成一个JSON格式的数据集,并自动完成数据标注,方便您快速创建和测试模型。
准备数据
1
NLP自学习平台提供创建标注任务和上传已标注数据两种方式帮助您完成模型数据的准备工作。
本教程以NLP控制台中预置的数据集为例进行介绍,预置数据集已自动完成数据准备的工作。
如果您需要使用其他数据进行训练模型的创建与训练,请参考产品帮助文档进行操作。
创建模型
15
在模型中心页签,单击底部创建模型。
在创建模型页面,完成模型配置。
添加训练数据时,选择创建项目时为您自动生成的JSON格式数据集。
单击提交。
模型创建完成,并自动开始训练。
训练时长根据数据量大小有所不同,以预置的100条数据为例,训练时长约为10分钟。
查看训练结果。
训练完成后,您可以在模型中心页签,定位到指定模型,单击查看,随时查看数据训练的结果。
以下是预置数据集的训练结果:
说明数据量过少会影响模型的精确率,建议数据量不低于500条。
测试模型
5
在模型中心页签,定位到指定模型,单击发布。
待模型状态变更为发布完成,单击测试。
在模型测试页面,上传需要测试的文件。
完成
2
完成以上操作后,您已经成功创建模型,并完成模型的训练和测试。
您可在模型测试页面,随时查看测试结果。

清理及后续
1
清理
本教程不涉及相关资源的占用,因此无需清理。
其他注意事项:
本教程使用的NLP自学习平台免费试用版提供3个免费模型供您使用,免费试用周期为一个月。
如果您已创建了3个模型,需要创建更多模型时,您需要删除已有的模型,释放模型的免费额度。
免费试用结束后,您的模型和数据会被暂时冻结,无法使用。购买模型后才可重新启用。
后续
无
总结
常用知识点
问题1:待标注文件中建议至少多少条数据再进行训练?(单选题)
正确答案是100,理想状态下建议500条。标注数据过少,会导致训练结果指标偏低。
问题2:标注数据时,标注人员是否可以设置为RAM用户?(单选题)
正确答案是可以。您可以将标注任务分配给您创建的阿里云子账号(即RAM用户)。被分配用户通过该RAM用户登录NLP自然语言处理控制台,即可参与数据标注。