模型优化

对于模型的优化,我们提供如下几个建议:

  1. 通常来说,样本数据直接影响某一类别的效果。建议有针对性地补充数据。比如,您发现模型对于某一类别效果较差,并且训练数据中的量不多(100条以下),很有可能是该类别数据量太少的原因,这时可以考虑补充该类别的数据。

  2. 如果某一类效果较差,并且训练数据量也足够(500条以上)。建议分析该类别的badcase,确定是否是数据标注问题。可能的原因有:a.标注质量不高,标注错误较多;b.标注规范不统一,标注容易不一致;b.该类别分类难度较大(判断标准:人工标注也容易出错)。