除了通过JSON文件来创建数据集的方式,如果您暂时没有标注数据,也可以通过我们的标注平台来标注数据,接下拉,通过一个例子来演示标注平台的使用。在第一步创建的项目中,选择创建标注任务
在这里我们使用JSON的方式来上传文件,具体格式参考上面我们预置测试数据集,然后单击下一步
在这里我们选择分类类型为单选分类,因为在我们的分类任务中,标签只能有一个。单击添加题目,可以看到如下画面之后返回到数据中心,单击标注即可标注数据,标注完成后,就得到了一个标注的数据集。
当构建好数据集后,模型就可以开始学习。需要知道的是模型所有的知识都来源于您输入的这个数据集,它不具备任何的先验知识。模型做出的所有判断都是依据从这个训练数据集中学到的知识,因此它不可能做出它认知外的判断。比如您的训练集中都是中文数据,那么训练得到的模型就不太能对英文数据做出准确的识别。再比如您的训练数据中只有“正确”,“错误”两种标签,那么它对于模糊的数据输出也不会为“不确定”,因为在模型的认知里,它只见过“正确”,“错误”这两种类别,无论您输入什么文本,模型都只能从这两者之中二选一。
文档内容是否对您有帮助?