全部产品
云市场
云游戏

数据标注

更新时间:2020-04-17 17:13:39

除了以上的通过 json 文件来创建数据集的方式,如果您暂时没有标注数据,也可以通过我们的标注平台来标注数据,接下来,通过一个例子来演示标注平台的使用。进入到项目后,点击“创建标注任务”,可以看到如下画面

cls-data-annotate-new

在这里我们使用 excel 的方式来上传文件,具体格式参考上面我们提供的数据,然后点击下一步

cls-data-annotate-2

在这里我们选择分类类型为单选分类,因为在我们的分类任务中,标签只能有一个。点击添加题目,可以看到如下画面

cls-data-annotate-3

之后返回到数据中心,点击标注即可标注数据,标注完成后,就得到了一个标注的数据集。

当构建好数据集后,模型就可以开始学习。需要知道的是模型所有的知识都来源于您输入的这个数据集,它不具备任何的先验知识。模型做出的所有判断都是依据从这个训练数据集中学到的知识,因此它不可能做出它认知外的判断。比如您的训练集中都是中文数据,那么训练得到的模型就不太能对英文数据做出准确的识别。再比如您的训练数据中只有“正”,“负”两种情感类型,那么它对中立情感的评论输出也不会为“中”,因为在模型的认知里,它只见过“正”,“负”这两种类别,无论您输入什么文本,模型都只能从这两者之中二选一。