对于模型的优化,我们提供如下几个建议:
换一个不同模型试试。不同的模型架构在不同的任务上表现可能不同,没有哪一个模型能够在所有任务中持续超出所有模型。所以,如果您发现 CNN效果不好,不妨换成 self-attention 试试看。
对于同一个模型调整模型的不同参数。即使是同一个模型,也会因为参数设置的不同而最终得到的效果不同。模型含有各种各样的超参数,为了减轻用户的负担,我们只开放了遍历次数和学习率两个参数。遍历次数一般不建议修改(除非您想快速训练完成),学习率参数有时对于模型的影响非常大,可以尝试在 0.001~0.0001 进行调整。
有时候上述对于模型的调整可能对于性能的提升都不是很大,这时可以考虑从数据层面来优化。比如数据的预处理阶段,尽可能去除掉对于结果无关的噪音。还可以尝试我们平台提供的数据增强功能,对数据集进行扩充。
分析 bad case,有针对性地补充数据。比如,您发现模型对于某一种类别经常分不对,很有可能是该类别数据量太少的原因,这时可以考虑补充该类别的数据。
文档内容是否对您有帮助?