全部产品
阿里云办公

索引重建

更新时间:2018-11-08 19:31:26

对于用户上传的数据(包括通过各个数据源的同步过来的数据)OpenSearch会在系统中保存一份镜像。如果有涉及到应用结构变更、或者需要导入全量数据的情况下,需要进行索引重建操作。目前支持两种索引重建方式:1)手动索引重建(一般用于修改应用结构或者导入全量用户数据时使用);2)每日定时任务(一般在odps等数据源每天导入全量用户数据使用。RDS默认开启数据同步,无需配置定时任务)。

索引重建

定时任务与手动任务的逻辑完全相同,只需要多配置一个每日同步的时间。需要注意的是:定时任务每天只会执行一次,一旦当天成功执行了一次,无论如何修改配置,都不会再次执行。定时任务

在索引重建任务开始之前,需要选择任务的类型:

  • 只重建索引:对应于应用结构有变化的情况,如果选择了这个操作,仅仅会重新构建应用的全部索引,不会拉取数据源中的数据
  • 重新导入数据并重建索引:一般对应于首次向OpenSearch中导入全量数据的场景,或任何需要从数据源中拉取全部数据,并重建索引的场景。在“重新导入数据并重建索引”的任务中,可以选择一张或多张表进行同步(也就是说不必须是全部的表)。OpenSearch会根据所选择的各个表之间的关系自动确定导入顺序。

任务成功创建之后,会显示任务执行的进度,点击进度条,可以查看进度详情。如果任务失败,可以在应用列表页中的错误日志中查询失败原因。

索引重建流程及进度

流程为:数据导入——数据处理——索引构建。

从数据源导入数据后,做数据处理,发给build服务做索引构建,全量导入的build任务是定期执行一轮,一轮的时间是30分钟左右。因此文档数很少的情况下,也可能需要一些时间完成全量任务。控制台的索引重建进度为阶段性展示。

注意:

新高级版以及标准版,使用“手动索引重建”或者“修改应用结构”生成一个新版本后,一个应用实例会在控制台存在新老两个版本。

  • 当存在两个版本时,只有一个版本的状态为正常(服务中),表示该版本当前提供搜索服务(当使用appname调用search接口时,默认搜索的版本)。
  • 当对某个版本执行了“切换到线上”的操作时,意味着另外一个版本被切换下线。该被切换下线的版本默认保留8小时,8小时后,该版本会被自动删除。
  • 版本删除后,不可恢复。