URL请求分类函数会自动将您输入的URL请求路径进行归类打标签,并提供类别的正则表达式,帮助您更好的归类URL,查询结果可供ETL使用。
说明
目前,URL请求分类函数只支持华北2(北京)、华东2(上海)地域。
-
调用方式
select url_classify(url_path varchar); select url_classify(url_path varchar, weight long); -
输入参数
参数
说明
url_path
URL请求路径。
weight
URL请求路径的数量。
-
输出参数
参数
说明
url_path
URL请求路径。
api_path
通过函数推导出URL请求路径对应的接口。
regex_tpl
通过算法推导出的正则表达式。
-
输出结果
url_path | api_path | regex_tpl -------------------------------------+------------------------------+------------------------------------- /gl/balance/666398186799140 | /gl/balance/* | \/gl\/balance\/[0-9].+ /gl/glaccount/30579281472076 | /gl/glaccount/* | \/gl\/glaccount\/[0-9].+ /gl/balance/709016207098025 | /gl/balance/* | \/gl\/balance\/[0-9].+ -
示例
-
查询分析语句
* | select url_classify(uri, num) from (select uri, COUNT(*) as num from log group by uri limit 1000) -
查询分析结果。查询结果返回三列:url_path(原始请求路径)、api_path(分类后的API路径模式,变量部分以
*替代)和 regex_tpl(对应的正则表达式模板)。例如原始路径/v1/task/20200403_064500_63933_w69w5.2.28/results/17/1被归类为/v1/task/*/results/17/1,对应正则模板为\/v1\/task\/.*\/results\/17\/1。
-
该文章对您有帮助吗?