本文档为您介绍加工引擎启动错误的原因以及排查处理方法。

数据加工任务的第一个环节便是启动加工引擎。该环节产生错误主要是由于在启动加工引擎过程时,检测到用户编写的LOG DSL规则存在错误,导致加工引擎内部的安全审核不通过。
加工引擎启动

错误日志

在加工引擎启动过程中,如果检测到用户编写的LOG DSL规则存在错误,会报如下形式的错误:
{
  "errorMessage": "ETL config doesn't pass security check, detail: XXXXXX"
}
说明 错误日志可以在数据加工诊断报表的异常详情中或者Logstore: internal-etl-log中查看。
  • 在加工引擎启动阶段产生错误时,加工任务会一直重试,直到重试成功或被手动停止。
  • 重试成功后(修改加工规则后),加工任务会继续正常工作,不会产生日志的丢失或冗余。

常见错误排查

  • 基本语法错误。

    用户编写LOG DSL规则过程中,写了不符合LOG DSL语法的错误加工规则,如多或者少括号、逗号写成冒号等。

    • 错误日志:
      {
        "errorMessage": "ETL config doesn't pass security check, detail: invalid syntax"
      }
      {
        "errorMessage": "ETL config doesn't pass security check, detail: unexpected EOF while parsing"
      }
      ...
    • 排查方法:
      根据错误日志中的traceback信息定位具体的语法错误位置。如下图所示,可以看到这里的LOG DSL语法错误是将e_set("test", v("status"))错写为了e_set("test": v("status"))
      错误日志语法
  • 非法使用运算符。
    LOG DSL中所有的操作都需要通过LOG DSL提供的函数来完成。数值运算、大小比较等操作都需要通过op_*的函数来完成,而不能直接使用+ - * / > <等运算符。
    • 错误日志:
      {
        "errorMessage": "ETL config doesn't pass security check, detail: invalid type detected: <class `_ast.BinOp`> "
      }
    • 排查方法:

      检查LOG DSL规则,确保所有的操作例如运算、大小比较等都使用了LOG DSL提供的函数来完成,没有使用LOG DSL提供的功能以外的非法运算符。

    • 错误及解决样例:
      e_set("b", v("a") - 10) # 错误
      e_set("b", op_sub(v("a"), 10)) # 正确
      
      e_set("b", v("a") >= v("c")) # 错误
      e_set("b", op_ge(v("a"), v("c"))) # 正确
  • 函数参数类型传递错误或调用不存在的函数。
    如果传递给函数的参数类型和函数接收的参数类型不一致,或者调用了不存在的函数,会产生错误。
    • 错误日志:
      {
        "errorMessage": "ETL config doesn't pass security check, detail: invalid call in detected: function_name"
      }
    • 排查方法:
      • 首先检查对应的函数是否存在,函数名是否拼写错误等;如果函数存在且名称正确,则检查函数的参数类型是否传递正确。
      • 根据错误日志中的traceback信息定位产生错误的函数。如下图所示,产生错误的函数是dt_totimestap。该函数是存在的,于是可以去检查规则中的调用dt_totimestap的地方,是否传递了正确类型的参数给该函数。
        函数错误信息
    • 错误及解决样例:
      #错误样例
      e_set("time1", "2019-06-03 2:41:26")
      e_set("time2", dt_totimestap(v("time1")))
      
      #正确样例
      e_set("time1", "2019-06-03 2:41:26")
      e_set("time2", dt_totimestap(dt_parse(v("time1"))))
      
      #正确样例
      e_set("time1", "2019-06-03 2:41:26")
      e_set("time2", dt_parsetimestamp(v("time1")))
      • dt_totimestap接收的参数类型是日期时间对象,此处v("time1")是字符串类型,此处传递了错误类型的参数给日期时间函数,引发报错。
      • 可以使用dt_parse函数将字符串转化为日期时间对象,再传递给dt_totimestamp。也可以使用dt_parsetimestap函数来代替dt_totimestamp函数,该函数可以接收字符串类型。
  • 在全局调用表达式函数。
    LOG DSL语法中提供两种类型的函数:全局操作函数和表达式函数。只有全局操作函数才能作为加工规则的一个步骤,在全局进行调用。如果在全局中调用表达式函数,则会产生错误。
    • 错误日志:
      {
        "errorMessage": "ETL config doesn't pass security check, detail:  invalid type detected: <class '_ast.Expr'>"
      }
    • 排查方法:

      检查是否在全局调用了表达式函数,作为加工规则的一个步骤。

    • 错误样例:
      #错误样例
      op_add(v("a"), v("b"))
      str_lower(v("name"))
      
      #正确样例
      e_set("add", op_add(v("a"), v("b")))
      e_set("lower", str_lower(v("name")))
  • 非法使用变量定义赋值。
    LOG DSL语法中不支持变量定义赋值,变量值只能通过无状态方式调用传递。
    • 错误日志:
      {
        "errorMessage": "ETL config doesn't pass security check, detail: invalid assign detected: variable_name"
      }
    • 排查方法:
      • 检查LOG DSL规则中是否使用了变量定义赋值。
      • 根据错误日志中的traceback信息定位产生错误的位置。
    • 错误及解决样例:
      #错误样例
      sum_value = op_add(v("a"), v("b"))
      e_set("sum", sum_value)
      
      #正确样例
      e_set("sum", op_add(v("a"), v("b")))