MetricStore HTTP API详情

日志服务提供多个用于查询时序指标或写入指标数据到MetricStore的API,这些API兼容Prometheus开源协议。本文介绍这些API的使用详情。

概述

Prometheus所提供的接口都在/api/v1目录下,MetricStore相关的API同样遵循此规则,其完整的URL为https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/。

变量

是否必填

说明

{sls-endpoint}

服务入口是访问一个Project及其内部数据的URL,日志服务提供私网域名和公网域名。更多信息,请参见服务入口

{project}

日志服务Project名称,更多信息,请参见管理Project

{metricstore}

您已创建的MetricStore。具体操作,请参见创建MetricStore

重要

在调用相关接口时,还需要进行BasicAuth鉴权,即需要设置Username为AccessKey ID,Password为AccessKey Secret。此处建议您使用RAM用户的AccessKey。您需授予RAM用户查询指定Project的权限。具体操作,请参见配置权限助手

另外,API接口支持STS鉴权。此时BasicAuth中的Password格式为{AccessKey Secret}${STS Token}。更多信息,请参见什么是STS

时序指标查询API

时序指标查询API包括Instant Queries API和Range Queries API。

Instant Queries API

Instant Queries API用于查询指定时间点的指标数据。

GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query

参数说明如下表所示。

变量

是否必填

说明

query

具体的PromQL语句。更多信息,请参见PromQL语法

time

执行查询的时间点,Unix时间戳格式,精确到秒。默认为最新时间。

timeout

执行查询的超时时间,单位:秒。

同时支持1s、2m、3h、4d等用法。更多信息,请参见Time Durations

lookback-delta

可用于自定义设置query.lookback-delta这项flag参数值,仅对当次Query有效,该值需遵循Time Durations用法,更多信息,请参见Time Durations。此参数表示PromQL计算中寻点过程的最大回溯区间,SLS时序库中该值默认为"3m"。

  • 示例代码

    curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/query?query=up&time=1676700699' \
    -u username:password \
    -H 'Content-Type: application/x-www-form-urlencoded'
    
    # 设置username和password为阿里云AccessKey。
  • 查询结果

    {
        "status": "success",
        "data": {
            "resultType": "vector",
            "result": [
                {
                    "metric": {
                        "__name__": "up",
                        "instance": "demo.promlabs.com:10001",
                        "job": "demo"
                    },
                    "value": [
                        1676700550.696,
                        "1"
                    ]
                },
                {
                    "metric": {
                        "__name__": "up",
                        "instance": "demo.promlabs.com:10000",
                        "job": "demo"
                    },
                    "value": [
                        1676700550.696,
                        "1"
                    ]
                }
            ]
        }
    }

Range Queries API

Range Queries API用于查询指定时间范围内多个时间点的指标数据。

GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query_range
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/query_range

参数说明如下表所示。

变量

是否必填

说明

query

具体的PromQL语句。更多信息,请参见PromQL语法

start

查询的起始时间点,Unix时间戳格式,精确到秒。

end

查询的截止时间点,Unix时间戳格式,精确到秒。

step

执行查询的间隔时间,单位:秒。

同时支持1s、2m、3h、4d等用法。更多信息,请参见Time Durations

timeout

执行查询的超时时间,单位:秒。

同时支持1s、2m、3h、4d等用法。更多信息,请参见Time Durations

lookback-delta

可用于自定义设置query.lookback-delta这项flag参数值,仅对当次Query有效,该值需遵循Time Durations用法,更多信息,请参见Time Durations。此参数表示PromQL计算中寻点过程的最大回溯区间,SLS时序库中该值默认为"3m"。

  • 示例代码

    查询2023-02-18 14:09:59到2023-02-18 14:16:39之间的指标数据,step为60s。

    curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/query_range?query=up&start=1676700599&end=1676700999&step=60s' \
    -u username:password \
    -H 'Content-Type: application/x-www-form-urlencoded'
    
    # 设置username和password为阿里云AccessKey。
  • 查询结果

    {
      "status": "success",
      "data": {
        "resultType": "matrix",
        "result": [
          {
            "metric": {
              "__name__": "up",
              "instance": "demo.promlabs.com:10000",
              "job": "demo"
            },
            "values": [
              [
                1676700599,
                "1"
              ],
              [
                1676700659,
                "1"
              ],
              [
                1676700719,
                "0"
              ],
              [
                1676700779,
                "0"
              ],
              [
                1676700839,
                "1"
              ],
              [
                1676700899,
                "0"
              ],
              [
                1676700959,
                "1"
              ]
            ]
          },
          {
            "metric": {
              "__name__": "up",
              "instance": "demo.promlabs.com:10001",
              "job": "demo"
            },
            "values": [
              [
                1676700599,
                "1"
              ],
              [
                1676700659,
                "1"
              ],
              [
                1676700719,
                "0"
              ],
              [
                1676700779,
                "0"
              ],
              [
                1676700839,
                "1"
              ],
              [
                1676700899,
                "1"
              ],
              [
                1676700959,
                "1"
              ]
            ]
          }
        ]
      }
    }

元数据查询API

日志服务还支持查询Label、LabelValue等元数据信息,即兼容了Prometheus中Querying metadata的相关接口。此类接口支持获取特定时间段内所有的metric、Label和LabelValue信息,但不包含时间戳与数值信息。

Query Series API

Query Series API用于查询指定时间段内特定条件下的所有MetricName以及该MetricName下所有的Label数值对。

GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/series
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/series

参数说明如下表所示。

变量

是否必填

说明

match[]

筛选条件,例如up{instance="demo.*"}。

您可以设置一个或多个值。

start

查询的起始时间点,Unix时间戳格式,精确到秒。

默认为当前时间的5分钟之前。

end

查询的截止时间点,Unix时间戳格式,精确到秒。

默认为当前时间。

重要

如果startend参数都是自定义的,该API也只支持查询end时间点之前5分钟的数据,即查询 (end - 5 minute, end) 区间内的数据

  • 配置示例

    curl -g -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/series?match[]=up{instance="demo.promlabs.com:10000"}&match[]=go_sched_latencies_seconds_bucket&start=1676700599&end=1676700999' \
    -u username:password \
    -H 'Content-Type: application/x-www-form-urlencoded'
    
    # 设置username和password为阿里云AccessKey。
  • 查询结果

    {
        "status": "success",
        "data": [
            {
                "__name__": "go_gc_duration_seconds_count",
                "instance": "demo.promlabs.com:10000",
                "job": "demo"
            },
            {
                "__name__": "go_gc_duration_seconds_count",
                "instance": "demo.promlabs.com:10001",
                "job": "demo"
            },
            {
                "__name__": "up",
                "instance": "demo.promlabs.com:10000",
                "job": "demo"
            }
        ]
    }

Query Label Names API

查询指定时间段内特定条件下所有的LabelName。

GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/labels
POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/labels

参数说明如下表所示。

变量

是否必填

说明

match[]

筛选条件,例如up{instance="demo.*"}。

您可以设置零个、一个或多个值。

start

查询区间的起始时间点,Unix时间戳格式,精确到秒。

默认为当前时间的5分钟之前。

end

查询区间的截止时间点,Unix时间戳格式,精确到秒。

默认为当前时间。

重要

如果startend参数都是自定义的,该API也只支持查询end时间点之前5分钟的数据,即查询 (end - 5 minute, end) 区间内的数据

  • 配置示例

    查询指定时间段内所有Metric的LabelName信息。

    curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/labels?start=1676700599&end=1676700999' \
    -u username:password \
    -H 'Content-Type: application/x-www-form-urlencoded'
    
    # 设置username和password为阿里云AccessKey。
  • 查询结果

    {
        "status": "success",
        "data": [
            "code",
            "instance",
            "job",
            "le",
            "method",
            "mode",
            "path",
            "quantile",
            "status",
            "type",
            "version",
            "__name__"
        ]
    }

Query Label Values API

Query Label Values API用于查询指定时间段内特定条件以及特定LabelName下所有的LabelValue信息。

重要

该接口URL中的<label_name>需替换为具体的LabelName。

GET https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/label/<label_name>/values

参数说明如下表所示。

变量

是否必填

说明

match[]

筛选条件,例如up{instance="demo.*"}。

您可以设置一个或多个值。

start

查询的起始时间点,Unix时间戳格式,精确到秒。

默认为当前时间的5分钟之前。

end

查询区间的截止时间点,Unix时间戳格式,精确到秒。

默认为当前时间。

重要

如果startend参数都是自定义的,该API也只支持查询end时间点之前5分钟的数据,即查询 (end - 5 minute, end) 区间内的数据

  • 配置示例

    查询指定时间段内up指标中,instance Label下所有LabelValue。

    curl -X GET 'https://haoqi-sls-metric-test.pub-cn-hangzhou.log.aliyuncs.com/prometheus/haoqi-sls-metric-test/prometheus-metrics/api/v1/label/instance/values?match[]=up&start=1676700599&end=1676700999' \
    -u username:password \
    -H 'Content-Type: application/x-www-form-urlencoded'
    
    # 设置username和password为阿里云AccessKey。
  • 查询结果

    {
        "status": "success",
        "data": [
            "demo.promlabs.com:10000",
            "demo.promlabs.com:10001",
            "demo.promlabs.com:10002"
        ]
    }

数据写入API

当前已支持通过在Prometheus进程的配置文件中配置remote_write参数的方式接入时序数据到MetricStore。具体操作,请参见通过Remote Write协议接入Prometheus监控数据。MetricStore已兼容Prometheus的remote write协议,即您可以直接通过HTTP访问remote_write接口的方式往MetricStore写入数据,不需要使用Prometheus进程。

MetricStore为兼容remote_write协议提供了如下接口,该接口支持解析时序数据并写入到后端存储中。

POST https://{project}.{sls-endpoint}/prometheus/{project}/{metricstore}/api/v1/write

示例代码如下所示。

import (
	"bytes"
	"flag"
	"fmt"
	"github.com/gogo/protobuf/proto"
	"github.com/golang/snappy"
	"github.com/prometheus/prometheus/prompb"
	"io/ioutil"
	"net/http"
	"time"
)

func MockRemoteWrite() {
	project := flag.String("project", "xxxx", "")
	metricStore := flag.String("metricstore", "xxxx", "")
	endpoint := flag.String("endpoint", "xxxx", "")
	akId := flag.String("akid", "xxxx", "") // AccessKey信息。
	akKey := flag.String("aksecret", "xxxx", "")
	flag.Parse()

	Url := fmt.Sprintf("https://%s.%s/prometheus/%s/%s/api/v1/write", *project, *endpoint, *project, *metricStore)
	timestamp := time.Now().UnixNano()
	timeSeries := []prompb.TimeSeries{
		{
			Labels: []prompb.Label{
				{Name: "__name__", Value: "test_metric"},
				{Name: "app", Value: "HOST"},
				{Name: "device", Value: "vda"},
			},
			Samples: []prompb.Sample{
				{Timestamp: timestamp / 1000000, Value: 100},
				{Timestamp: timestamp/1000000 + 10000, Value: 200},
				{Timestamp: timestamp/1000000 + 20000, Value: 400},
				{Timestamp: timestamp/1000000 + 30000, Value: 300},
			},
		},
		{
			Labels: []prompb.Label{
				{Name: "__name__", Value: "test_metric"},
				{Name: "app", Value: "HOST"},
				{Name: "device", Value: "vda"},
				{Name: "uid", Value: "123456"},
			},
			Samples: []prompb.Sample{
				{Timestamp: timestamp / 1000000, Value: 100},
				{Timestamp: timestamp/1000000 + 10000, Value: 200},
				{Timestamp: timestamp/1000000 + 20000, Value: 400},
				{Timestamp: timestamp/1000000 + 30000, Value: 600},
			},
		},
	}
	data, _ := proto.Marshal(&prompb.WriteRequest{Timeseries: timeSeries})
	bufBody := snappy.Encode(nil, data)
	rwR, err := http.NewRequest("POST", Url, ioutil.NopCloser(bytes.NewReader(bufBody)))
	rwR.Header.Add("Content-Encoding", "snappy")
	rwR.Header.Set("Content-Type", "application/x-protobuf")
	rwR.SetBasicAuth(*akId, *akKey) // 设置basic auth信息。
	if err != nil {
		fmt.Println(err.Error())
		return
	}

	start := time.Now().UnixNano() / 1000000 //ms
	do, err := client.Do(rwR)
	end := time.Now().UnixNano() / 1000000 // ms
	if err != nil {
		panic(err)
	}
	status, result := parseResp(do)

	fmt.Println("status:", status, "result:", result, "duration:", end-start)
}

func parseResp(resp *http.Response) (status, data string) {
	defer resp.Body.Close()
	body, err := ioutil.ReadAll(resp.Body) // 需要读完body内容。
	if err != nil {
		panic(err)
	}
	return resp.Status, string(body)
}

SDK示例

通过HTTP方式访问查询API

import (
	"flag"
	"fmt"
	"io/ioutil"
	"net/http"
	"net/url"
	"strconv"
	"strings"
	"time"
)

const separator = "#"

func http_main() {

	project := flag.String("project", "xxxx", "")
	metricStore := flag.String("metricstore", "xxxx", "")
	endpoint := flag.String("endpoint", "xxxx", "")
	akId := flag.String("akid", "xxxx", "")
	akKey := flag.String("aksecret", "xxxx", "")
	query := flag.String("query", "avg(up)", "")
	queryType := flag.String("type", "values", "range or query or labels or values or series")
	matches := flag.String("match", "up", "") // 多个match[]参数使用#进行连接。
	labelName := flag.String("label", "instance", "")
	step := flag.String("step", "1m", "")
	fromtime := flag.String("from", "2023-02-15T00:00:00Z", "time 2006-01-02T15:04:05Z07:00")
	totime := flag.String("to", "2023-02-15T00:15:00Z", "time 2006-01-02T15:04:05Z07:00")

	flag.Parse()

	timeFrom, err := time.Parse(time.RFC3339, *fromtime)
	if err != nil {
		panic(err)
	}
	timeTo, err := time.Parse(time.RFC3339, *totime)
	if err != nil {
		panic(err)
	}

	// URL:https://{project}.{sls-enpoint}/prometheus/{project}/{metricstore}
	prometheusEndpoint := fmt.Sprintf("https://%s/prometheus/%s/%s", *project+"."+*endpoint, *project, *metricStore)

	var uri string
	urlVal := url.Values{}
	urlVal.Add("start", strconv.FormatInt(timeFrom.Unix(), 10))
	urlVal.Add("end", strconv.FormatInt(timeTo.Unix(), 10))

	switch *queryType {
	case "range":
		urlVal.Add("query", *query)
		urlVal.Add("step", *step)
		uri = fmt.Sprintf("%s/api/v1/query_range?%v", prometheusEndpoint, urlVal.Encode())
	case "query":
		urlVal.Add("query", *query)
		urlVal.Add("time", strconv.FormatInt(timeTo.Unix(), 10))
		uri = fmt.Sprintf("%s/api/v1/query?%v", prometheusEndpoint, urlVal.Encode())
	case "labels":
		extractAddMatches(*matches, urlVal)
		uri = fmt.Sprintf("%s/api/v1/labels?%v", prometheusEndpoint, urlVal.Encode())
	case "values":
		extractAddMatches(*matches, urlVal)
		uri = fmt.Sprintf("%s/api/v1/label/%s/values?%v", prometheusEndpoint, *labelName, urlVal.Encode())
	case "series":
		extractAddMatches(*matches, urlVal)
		uri = fmt.Sprintf("%s/api/v1/series?%v", prometheusEndpoint, urlVal.Encode())
	}

	req, _ := http.NewRequest(http.MethodGet, uri, nil)
	req.SetBasicAuth(*akId, *akKey)

	resp, err := http.DefaultClient.Do(req)
	if err != nil {
		panic(err)
	}
	buf, err := ioutil.ReadAll(resp.Body)
	resp.Body.Close()
	if err != nil {
		panic(err)
	}

	fmt.Println(string(buf))

}

func extractAddMatches(matches string, uVal url.Values) {
	splits := strings.Split(matches, separator)
	for _, match := range splits {
		uVal.Add("match[]", match)
	}
}

通过Prometheus SDK访问查询API

本示例基于Prometheus client_golangv1.14.0版本。

import (
	"context"
	"flag"
	"fmt"
	"github.com/prometheus/client_golang/api"
	v1 "github.com/prometheus/client_golang/api/prometheus/v1"
	"net"
	"net/http"
	"net/url"
	"time"
)

func main() {
	project := flag.String("project", "xxxx", "")
	metricStore := flag.String("metricstore", "xxxx", "")
	endpoint := flag.String("endpoint", "xxxx", "")
	akId := flag.String("akid", "xxxx", "")
	akKey := flag.String("aksecret", "xxxx", "")
	flag.Parse()

	// URL:https://{project}.{sls-enpoint}/prometheus/{project}/{metricstore}
	prometheusEndpoint := fmt.Sprintf("https://%s.%s/prometheus/%s/%s", *project, *endpoint, *project, *metricStore)

	client, err := api.NewClient(api.Config{
		Address: prometheusEndpoint,
		RoundTripper: &http.Transport{
			// set basic auth
			Proxy: func(req *http.Request) (*url.URL, error) {
				req.SetBasicAuth(*akId, *akKey)
				return nil, nil
			},
			DialContext: (&net.Dialer{
				Timeout:   60 * time.Second,
				KeepAlive: 60 * time.Second,
			}).DialContext,
			TLSHandshakeTimeout: 10 * time.Second,
		},
	})
	if err != nil {
		panic(err)
	}

	v1api := v1.NewAPI(client)
	ctx, _ := context.WithTimeout(context.Background(), 60*time.Second)
	r := v1.Range{
		Start: time.Now().Add(-15 * time.Minute),
		End:   time.Now(),
		Step:  time.Minute,
	}
	// query range
	result, warnings, err := v1api.QueryRange(ctx, "avg(up)", r)
	if err != nil {
		panic(err)
	}
	if len(warnings) > 0 {
		fmt.Printf("Warnings: %v %v\n", warnings, result)
	}
	fmt.Println(result)

	// query
	result, warnings, err = v1api.Query(ctx, "avg(up)", time.Now())
	if err != nil {
		panic(err)
	}
	if len(warnings) > 0 {
		fmt.Printf("Warnings: %v %v\n", warnings, result)
	}
	fmt.Println(result)

	// series
	series, warnings, err := v1api.Series(ctx, []string{"up"}, time.Now().Add(-15*time.Minute), time.Now())
	if err != nil {
		panic(err)
	}
	if len(warnings) > 0 {
		fmt.Printf("Warnings: %v %v\n", warnings, result)
	}
	fmt.Println(series)

	// labels
	names, warnings, err := v1api.LabelNames(ctx, []string{"up"}, time.Now().Add(-15*time.Minute), time.Now())
	if err != nil {
		panic(err)
	}
	if len(warnings) > 0 {
		fmt.Printf("Warnings: %v %v\n", warnings, result)
	}
	fmt.Println(names)

	// labelValues
	values, warnings, err := v1api.LabelValues(ctx, "instance", []string{"up"}, time.Now().Add(-15*time.Minute), time.Now())
	if err != nil {
		panic(err)
	}
	if len(warnings) > 0 {
		fmt.Printf("Warnings: %v %v\n", warnings, result)
	}
	fmt.Println(values)
}

响应结构

查询API和写入API的响应结构如下:

{
  "status": "success" | "error",
  "data": <data>,

  // 执行查询分析出现错误时,返回以下两项内容。
  "errorType": "<string>",
  "error": "<string>",
  
	// 返回警告信息,一般为查询不完整问题。
  "warnings": ["<string>"]
}

错误处理

常见的错误处理如下所示。

鉴权失败

返回如下信息时,表示鉴权失败,请修改您输入的AccessKey。

{
    "status": "error",
    "errorType": "unauthorized",
    "error": "get query instance error: {\n    \"httpCode\": 401,\n    \"errorCode\": \"Unauthorized\",\n    \"errorMessage\": \"AccessKeyId not found: xxxx\",\n    \"requestID\": \"xxxx\"\n}"
}

PromQL语句存在错误

返回如下信息时,表示PromQL语句存在错误,请修改query参数中的查询语句。

--> /api/v1/query_range?query=up[2m]&start=1676700599&end=1676700999&step=60s
{
    "status": "error",
    "errorType": "bad_data",
    "error": "invalid expression type \"range vector\" for range query, must be Scalar or instant Vector"
}

超时错误

返回如下信息时,表示超时错误,请调高timeout参数的值。

{
    "status": "error",
    "errorType": "timeout",
    "error": "query timed out in expression evaluation"
}

查询不完整

返回如下信息时,表示查询不完整,建议缩小查询时间范围,重新查询。

{
    "status": "success",
    "data": {
        "resultType": "matrix",
        "result": [
            {
                "metric": {},
                "values": [
                    [
                        1673798460,
                        "11111111"
                    ],
                    [
                        1673799060,
                        "22222222"
                    ],
                    [
                        1673799660,
                        "33333333"
                    ]
                ]
            }
        ]
    },
    "warnings": [
        "Request to Sls partial incompleted, incomplete task count : 11, total : 108"
    ]
}