本节介绍一些优化的建议。

优化建议如下:

  • 建议事实表进行基于时间的分区,并定时运行Optimize动作。Optimize建议运行在已经完成的分区上,避开当前正在写入的分区(否则当前分区写完后仍然需要再进行一次针对当前分区的Optimize)。
  • 定期运行Vacuum动作,设置合理的保留时间,默认保留时间为7天。
  • 流式入库时,设置合理的batch大小。如果batch size较小,实时性会好一些,但是写入吞吐会下降。在上游数据压力较大时,适当提高batch size有助于提升写入吞吐,例如,在实时要求不是很高的场景,可以将batch size设置为1000或者10000。