日志服务提供多个用于查询时序指标或写入指标数据到MetricStore的API,这些API兼容Prometheus开源协议。本文介绍这些API的使用详情。
概述
Prometheus所提供的接口都在/api/v1目录下,MetricStore相关的API同样遵循此规则,其完整的URL为https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/。
变量 | 是否必填 | 说明 |
{sls-endpoint} | 是 | 服务入口是访问一个Project及其内部数据的URL,日志服务提供私网域名和公网域名。更多信息,请参见服务入口。 |
{project} | 是 | 日志服务Project名称,更多信息,请参见管理Project。 |
{metricstore} | 是 | 您已创建的MetricStore。具体操作,请参见创建MetricStore。 |
时序指标查询API
时序指标查询API包括Instant Queries API和Range Queries API。
Instant Queries API
Instant Queries API用于查询指定时间点的指标数据。
GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query
参数说明如下表所示。
变量 | 是否必填 | 说明 |
query | 是 | 具体的PromQL语句。更多信息,请参见PromQL语法。 |
time | 否 | 执行查询的时间点,Unix时间戳格式,精确到秒。默认为最新时间。 |
timeout | 否 | 执行查询的超时时间,单位:秒。 同时支持1s、2m、3h、4d等用法。更多信息,请参见Time Durations。 |
lookback-delta | 否 | 可用于自定义设置query.lookback-delta这项flag参数值,仅对当次Query有效,该值需遵循Time Durations用法,更多信息,请参见Time Durations。此参数表示PromQL计算中寻点过程的最大回溯区间,SLS时序库中该值默认为"3m"。 |
示例代码
curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/query?query=up&time=1676700699' \ -u username:password \ -H 'Content-Type: application/x-www-form-urlencoded' # 设置username和password为阿里云AccessKey。
查询结果
{ "status": "success", "data": { "resultType": "vector", "result": [ { "metric": { "__name__": "up", "instance": "demo.promlabs.com:10001", "job": "demo" }, "value": [ 1676700550.696, "1" ] }, { "metric": { "__name__": "up", "instance": "demo.promlabs.com:10000", "job": "demo" }, "value": [ 1676700550.696, "1" ] } ] } }
Range Queries API
Range Queries API用于查询指定时间范围内多个时间点的指标数据。
GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query_range
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query_range
参数说明如下表所示。
变量 | 是否必填 | 说明 |
query | 是 | 具体的PromQL语句。更多信息,请参见PromQL语法。 |
start | 否 | 查询的起始时间点,Unix时间戳格式,精确到秒。 |
end | 否 | 查询的截止时间点,Unix时间戳格式,精确到秒。 |
step | 否 | 执行查询的间隔时间,单位:秒。 同时支持1s、2m、3h、4d等用法。更多信息,请参见Time Durations。 |
timeout | 否 | 执行查询的超时时间,单位:秒。 同时支持1s、2m、3h、4d等用法。更多信息,请参见Time Durations。 |
lookback-delta | 否 | 可用于自定义设置query.lookback-delta这项flag参数值,仅对当次Query有效,该值需遵循Time Durations用法,更多信息,请参见Time Durations。此参数表示PromQL计算中寻点过程的最大回溯区间,SLS时序库中该值默认为"3m"。 |
示例代码
查询2023-02-18 14:09:59到2023-02-18 14:16:39之间的指标数据,step为60s。
curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/query_range?query=up&start=1676700599&end=1676700999&step=60s' \ -u username:password \ -H 'Content-Type: application/x-www-form-urlencoded' # 设置username和password为阿里云AccessKey。
查询结果
{ "status": "success", "data": { "resultType": "matrix", "result": [ { "metric": { "__name__": "up", "instance": "demo.promlabs.com:10000", "job": "demo" }, "values": [ [ 1676700599, "1" ], [ 1676700659, "1" ], [ 1676700719, "0" ], [ 1676700779, "0" ], [ 1676700839, "1" ], [ 1676700899, "0" ], [ 1676700959, "1" ] ] }, { "metric": { "__name__": "up", "instance": "demo.promlabs.com:10001", "job": "demo" }, "values": [ [ 1676700599, "1" ], [ 1676700659, "1" ], [ 1676700719, "0" ], [ 1676700779, "0" ], [ 1676700839, "1" ], [ 1676700899, "1" ], [ 1676700959, "1" ] ] } ] } }
元数据查询API
日志服务还支持查询Label、LabelValue等元数据信息,即兼容了Prometheus中Querying metadata的相关接口。此类接口支持获取特定时间段内所有的metric、Label和LabelValue信息,但不包含时间戳与数值信息。
Query Series API
Query Series API用于查询指定时间段内特定条件下的所有MetricName以及该MetricName下所有的Label数值对。
GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/series
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/series
参数说明如下表所示。
变量 | 是否必填 | 说明 |
match[] | 是 | 筛选条件,例如up{instance="demo.*"}。 您可以设置一个或多个值。 |
start | 否 | 查询的起始时间点,Unix时间戳格式,精确到秒。 默认为当前时间的5分钟之前。 |
end | 否 | 查询的截止时间点,Unix时间戳格式,精确到秒。 默认为当前时间。 重要 如果start和end参数都是自定义的,该API也只支持查询end时间点之前5分钟的数据,即查询 (end - 5 minute, end) 区间内的数据。 |
配置示例
curl -g -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/series?match[]=up{instance="demo.promlabs.com:10000"}&match[]=go_sched_latencies_seconds_bucket&start=1676700599&end=1676700999' \ -u username:password \ -H 'Content-Type: application/x-www-form-urlencoded' # 设置username和password为阿里云AccessKey。
查询结果
{ "status": "success", "data": [ { "__name__": "go_gc_duration_seconds_count", "instance": "demo.promlabs.com:10000", "job": "demo" }, { "__name__": "go_gc_duration_seconds_count", "instance": "demo.promlabs.com:10001", "job": "demo" }, { "__name__": "up", "instance": "demo.promlabs.com:10000", "job": "demo" } ] }
Query Label Names API
查询指定时间段内特定条件下所有的LabelName。
GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/labels
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/labels
参数说明如下表所示。
变量 | 是否必填 | 说明 |
match[] | 是 | 筛选条件,例如up{instance="demo.*"}。 您可以设置零个、一个或多个值。 |
start | 否 | 查询区间的起始时间点,Unix时间戳格式,精确到秒。 默认为当前时间的5分钟之前。 |
end | 否 | 查询区间的截止时间点,Unix时间戳格式,精确到秒。 默认为当前时间。 重要 如果start和end参数都是自定义的,该API也只支持查询end时间点之前5分钟的数据,即查询 (end - 5 minute, end) 区间内的数据。 |
配置示例
查询指定时间段内所有Metric的LabelName信息。
curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/labels?start=1676700599&end=1676700999' \ -u username:password \ -H 'Content-Type: application/x-www-form-urlencoded' # 设置username和password为阿里云AccessKey。
查询结果
{ "status": "success", "data": [ "code", "instance", "job", "le", "method", "mode", "path", "quantile", "status", "type", "version", "__name__" ] }
Query Label Values API
Query Label Values API用于查询指定时间段内特定条件以及特定LabelName下所有的LabelValue信息。
该接口URL中的<label_name>需替换为具体的LabelName。
GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/label/<label_name>/values
参数说明如下表所示。
变量 | 是否必填 | 说明 |
match[] | 是 | 筛选条件,例如up{instance="demo.*"}。 您可以设置一个或多个值。 |
start | 否 | 查询的起始时间点,Unix时间戳格式,精确到秒。 默认为当前时间的5分钟之前。 |
end | 否 | 查询区间的截止时间点,Unix时间戳格式,精确到秒。 默认为当前时间。 重要 如果start和end参数都是自定义的,该API也只支持查询end时间点之前5分钟的数据,即查询 (end - 5 minute, end) 区间内的数据。 |
配置示例
查询指定时间段内up指标中,instance Label下所有LabelValue。
curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/label/instance/values?match[]=up&start=1676700599&end=1676700999' \ -u username:password \ -H 'Content-Type: application/x-www-form-urlencoded' # 设置username和password为阿里云AccessKey。
查询结果
{ "status": "success", "data": [ "demo.promlabs.com:10000", "demo.promlabs.com:10001", "demo.promlabs.com:10002" ] }
数据写入API
当前已支持通过在Prometheus进程的配置文件中配置remote_write参数的方式接入时序数据到MetricStore。具体操作,请参见通过Remote Write协议接入Prometheus监控数据。MetricStore已兼容Prometheus的remote write协议,即您可以直接通过HTTP访问remote_write接口的方式往MetricStore写入数据,不需要使用Prometheus进程。
MetricStore为兼容remote_write协议提供了如下接口,该接口支持解析时序数据并写入到后端存储中。
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/write
示例代码如下所示。
import (
"bytes"
"flag"
"fmt"
"github.com/gogo/protobuf/proto"
"github.com/golang/snappy"
"github.com/prometheus/prometheus/prompb"
"io/ioutil"
"net/http"
"time"
)
func MockRemoteWrite() {
project := flag.String("project", "xxxx", "")
metricStore := flag.String("metricstore", "xxxx", "")
endpoint := flag.String("endpoint", "xxxx", "")
akId := flag.String("akid", "xxxx", "") // AccessKey信息。
akKey := flag.String("aksecret", "xxxx", "")
flag.Parse()
Url := fmt.Sprintf("https://%s.%s/prometheus/%s/%s/api/v1/write", *project, *endpoint, *project, *metricStore)
timestamp := time.Now().UnixNano()
timeSeries := []prompb.TimeSeries{
{
Labels: []prompb.Label{
{Name: "__name__", Value: "test_metric"},
{Name: "app", Value: "HOST"},
{Name: "device", Value: "vda"},
},
Samples: []prompb.Sample{
{Timestamp: timestamp / 1000000, Value: 100},
{Timestamp: timestamp/1000000 + 10000, Value: 200},
{Timestamp: timestamp/1000000 + 20000, Value: 400},
{Timestamp: timestamp/1000000 + 30000, Value: 300},
},
},
{
Labels: []prompb.Label{
{Name: "__name__", Value: "test_metric"},
{Name: "app", Value: "HOST"},
{Name: "device", Value: "vda"},
{Name: "uid", Value: "123456"},
},
Samples: []prompb.Sample{
{Timestamp: timestamp / 1000000, Value: 100},
{Timestamp: timestamp/1000000 + 10000, Value: 200},
{Timestamp: timestamp/1000000 + 20000, Value: 400},
{Timestamp: timestamp/1000000 + 30000, Value: 600},
},
},
}
data, _ := proto.Marshal(&prompb.WriteRequest{Timeseries: timeSeries})
bufBody := snappy.Encode(nil, data)
rwR, err := http.NewRequest("POST", Url, ioutil.NopCloser(bytes.NewReader(bufBody)))
rwR.Header.Add("Content-Encoding", "snappy")
rwR.Header.Set("Content-Type", "application/x-protobuf")
rwR.SetBasicAuth(*akId, *akKey) // 设置basic auth信息。
if err != nil {
fmt.Println(err.Error())
return
}
start := time.Now().UnixNano() / 1000000 //ms
do, err := client.Do(rwR)
end := time.Now().UnixNano() / 1000000 // ms
if err != nil {
panic(err)
}
status, result := parseResp(do)
fmt.Println("status:", status, "result:", result, "duration:", end-start)
}
func parseResp(resp *http.Response) (status, data string) {
defer resp.Body.Close()
body, err := ioutil.ReadAll(resp.Body) // 需要读完body内容。
if err != nil {
panic(err)
}
return resp.Status, string(body)
}
SDK示例
通过HTTP方式访问查询API
import (
"flag"
"fmt"
"io/ioutil"
"net/http"
"net/url"
"strconv"
"strings"
"time"
)
const separator = "#"
func http_main() {
project := flag.String("project", "xxxx", "")
metricStore := flag.String("metricstore", "xxxx", "")
endpoint := flag.String("endpoint", "xxxx", "")
akId := flag.String("akid", "xxxx", "")
akKey := flag.String("aksecret", "xxxx", "")
query := flag.String("query", "avg(up)", "")
queryType := flag.String("type", "values", "range or query or labels or values or series")
matches := flag.String("match", "up", "") // 多个match[]参数使用#进行连接。
labelName := flag.String("label", "instance", "")
step := flag.String("step", "1m", "")
fromtime := flag.String("from", "2023-02-15T00:00:00Z", "time 2006-01-02T15:04:05Z07:00")
totime := flag.String("to", "2023-02-15T00:15:00Z", "time 2006-01-02T15:04:05Z07:00")
flag.Parse()
timeFrom, err := time.Parse(time.RFC3339, *fromtime)
if err != nil {
panic(err)
}
timeTo, err := time.Parse(time.RFC3339, *totime)
if err != nil {
panic(err)
}
// URL:https://{project}.{sls-enpoint}/prometheus/{project}/{metricstore}
prometheusEndpoint := fmt.Sprintf("https://%s/prometheus/%s/%s", *project+"."+*endpoint, *project, *metricStore)
var uri string
urlVal := url.Values{}
urlVal.Add("start", strconv.FormatInt(timeFrom.Unix(), 10))
urlVal.Add("end", strconv.FormatInt(timeTo.Unix(), 10))
switch *queryType {
case "range":
urlVal.Add("query", *query)
urlVal.Add("step", *step)
uri = fmt.Sprintf("%s/api/v1/query_range?%v", prometheusEndpoint, urlVal.Encode())
case "query":
urlVal.Add("query", *query)
urlVal.Add("time", strconv.FormatInt(timeTo.Unix(), 10))
uri = fmt.Sprintf("%s/api/v1/query?%v", prometheusEndpoint, urlVal.Encode())
case "labels":
extractAddMatches(*matches, urlVal)
uri = fmt.Sprintf("%s/api/v1/labels?%v", prometheusEndpoint, urlVal.Encode())
case "values":
extractAddMatches(*matches, urlVal)
uri = fmt.Sprintf("%s/api/v1/label/%s/values?%v", prometheusEndpoint, *labelName, urlVal.Encode())
case "series":
extractAddMatches(*matches, urlVal)
uri = fmt.Sprintf("%s/api/v1/series?%v", prometheusEndpoint, urlVal.Encode())
}
req, _ := http.NewRequest(http.MethodGet, uri, nil)
req.SetBasicAuth(*akId, *akKey)
resp, err := http.DefaultClient.Do(req)
if err != nil {
panic(err)
}
buf, err := ioutil.ReadAll(resp.Body)
resp.Body.Close()
if err != nil {
panic(err)
}
fmt.Println(string(buf))
}
func extractAddMatches(matches string, uVal url.Values) {
splits := strings.Split(matches, separator)
for _, match := range splits {
uVal.Add("match[]", match)
}
}
通过Prometheus SDK访问查询API
本示例基于Prometheus client_golangv1.14.0版本。
import (
"context"
"flag"
"fmt"
"github.com/prometheus/client_golang/api"
v1 "github.com/prometheus/client_golang/api/prometheus/v1"
"net"
"net/http"
"net/url"
"time"
)
func main() {
project := flag.String("project", "xxxx", "")
metricStore := flag.String("metricstore", "xxxx", "")
endpoint := flag.String("endpoint", "xxxx", "")
akId := flag.String("akid", "xxxx", "")
akKey := flag.String("aksecret", "xxxx", "")
flag.Parse()
// URL:https://{project}.{sls-enpoint}/prometheus/{project}/{metricstore}
prometheusEndpoint := fmt.Sprintf("https://%s.%s/prometheus/%s/%s", *project, *endpoint, *project, *metricStore)
client, err := api.NewClient(api.Config{
Address: prometheusEndpoint,
RoundTripper: &http.Transport{
// set basic auth
Proxy: func(req *http.Request) (*url.URL, error) {
req.SetBasicAuth(*akId, *akKey)
return nil, nil
},
DialContext: (&net.Dialer{
Timeout: 60 * time.Second,
KeepAlive: 60 * time.Second,
}).DialContext,
TLSHandshakeTimeout: 10 * time.Second,
},
})
if err != nil {
panic(err)
}
v1api := v1.NewAPI(client)
ctx, _ := context.WithTimeout(context.Background(), 60*time.Second)
r := v1.Range{
Start: time.Now().Add(-15 * time.Minute),
End: time.Now(),
Step: time.Minute,
}
// query range
result, warnings, err := v1api.QueryRange(ctx, "avg(up)", r)
if err != nil {
panic(err)
}
if len(warnings) > 0 {
fmt.Printf("Warnings: %v %v\n", warnings, result)
}
fmt.Println(result)
// query
result, warnings, err = v1api.Query(ctx, "avg(up)", time.Now())
if err != nil {
panic(err)
}
if len(warnings) > 0 {
fmt.Printf("Warnings: %v %v\n", warnings, result)
}
fmt.Println(result)
// series
series, warnings, err := v1api.Series(ctx, []string{"up"}, time.Now().Add(-15*time.Minute), time.Now())
if err != nil {
panic(err)
}
if len(warnings) > 0 {
fmt.Printf("Warnings: %v %v\n", warnings, result)
}
fmt.Println(series)
// labels
names, warnings, err := v1api.LabelNames(ctx, []string{"up"}, time.Now().Add(-15*time.Minute), time.Now())
if err != nil {
panic(err)
}
if len(warnings) > 0 {
fmt.Printf("Warnings: %v %v\n", warnings, result)
}
fmt.Println(names)
// labelValues
values, warnings, err := v1api.LabelValues(ctx, "instance", []string{"up"}, time.Now().Add(-15*time.Minute), time.Now())
if err != nil {
panic(err)
}
if len(warnings) > 0 {
fmt.Printf("Warnings: %v %v\n", warnings, result)
}
fmt.Println(values)
}
响应结构
查询API和写入API的响应结构如下:
{
"status": "success" | "error",
"data": <data>,
// 执行查询分析出现错误时,返回以下两项内容。
"errorType": "<string>",
"error": "<string>",
// 返回警告信息,一般为查询不完整问题。
"warnings": ["<string>"]
}
错误处理
常见的错误处理如下所示。
鉴权失败
返回如下信息时,表示鉴权失败,请修改您输入的AccessKey。
{
"status": "error",
"errorType": "unauthorized",
"error": "get query instance error: {\n \"httpCode\": 401,\n \"errorCode\": \"Unauthorized\",\n \"errorMessage\": \"AccessKeyId not found: xxxx\",\n \"requestID\": \"xxxx\"\n}"
}
PromQL语句存在错误
返回如下信息时,表示PromQL语句存在错误,请修改query参数中的查询语句。
--> /api/v1/query_range?query=up[2m]&start=1676700599&end=1676700999&step=60s
{
"status": "error",
"errorType": "bad_data",
"error": "invalid expression type \"range vector\" for range query, must be Scalar or instant Vector"
}
超时错误
返回如下信息时,表示超时错误,请调高timeout参数的值。
{
"status": "error",
"errorType": "timeout",
"error": "query timed out in expression evaluation"
}
查询不完整
返回如下信息时,表示查询不完整,建议缩小查询时间范围,重新查询。
{
"status": "success",
"data": {
"resultType": "matrix",
"result": [
{
"metric": {},
"values": [
[
1673798460,
"11111111"
],
[
1673799060,
"22222222"
],
[
1673799660,
"33333333"
]
]
}
]
},
"warnings": [
"Request to Sls partial incompleted, incomplete task count : 11, total : 108"
]
}