多值数据查询

更新时间:

本文介绍多值数据查询方法。

多值模型数据查询 mquery

请求路径和方法

请求路径

请求方法

描述

/api/mquery

POST

查询数据

重要

多值模型数据和原来写入的单值模型数据不兼容。单值模型数据需要通过原有的/api/put接口进行写入。同时多值写入数据需要通过/api/mquery接口进行查询,单值写入的数据需要通过/api/query进行查询。

请求内容

名称

类型

是否必选

描述

默认值

举例

start

Long

开始时间,单位为秒或者毫秒。判断规则详见下面的“时间戳说明”。

1499158925

end

Long

结束时间,单位为秒或者毫秒。判断规则详见下面的“时间戳说明”。默认值为TSDB服务器当前时间。

当前时间

1499162916

queries

Array

子查询数组。

见子查询说明

msResolution

boolean

子查询数组。

false

该参数只对原始数据单位是秒的查询生效。当该参数设置为true时,查询结果中的时间戳会转换为毫秒,否则仍保留原始时间单位,对于原始数据是毫秒的查询,返回结果中时间戳始终为毫秒。

hint

Map

查询Hint化。

见查询Hint化说明。

时间戳说明

时间戳的单位可以是秒或者毫秒。TSDB会通过数值大小来判断时间戳的单位,规则如下:

  • 时间戳区间为 [4284768,9999999999]:判断为秒,表示的日期时间区间为:[1970-02-20 00:59:28,2286-11-21 01:46:39] 。

  • 时间戳区间为 [10000000000,9999999999999]:判断为毫秒,表示的日期时间区间为:[1970-04-27 01:46:40.000,,2286-11-21 01:46:39.999] 。

  • 时间戳区间为 (-∞,4284768)和(9999999999999,+∞):判断为非法时间戳区间。

    说明

    适用于写入数据 (/api/put & /api/mput)和查询数据(/api/query & /api/mquery)两个接口。

单时间点数据查询

TSDB支持单时间点数据查询。您可以将开始时间和结束时间设置为相同的数值。

例如:"start":1356998400"end":1356998400

子查询 JSON 格式

名称

类型

是否必选

描述

默认值

举例

metric

String

指标名。

wind

fields

List

域查询信息。

-

rate

Boolean

是否计算指定指标值的增长速率,计算公式:Vt-Vt-1/t1-t-1。

false

true

delta

Boolean

是否计算指定指标值的差值,计算公式:Vt-Vt-1。

false

true

limit

Integer

数据分页,子查询每条时间序列返回数据点的最大数目。

0

1000

offset

Integer

数据分页,子查询每条时间序列返回数据点的偏移量。

0

500

dpValue

String

根据提供条件过滤返回数据点,支持“>”,“<”, “=”,”<=”, “>=”, “!=”。

>=1000

preDpValue

String

根据提供的条件在扫描原始数据点时进行过滤,支持”>”, “<”, “=”,”<=”, “>=”, “!=”。

说明

它与dpValue的不同在于前者是对查询完成后计算的结果进行值过滤,后者是在存储的数据点进行扫描时进行值过滤,使得不满足过滤条件的数据点根本不会加入查询计算。

>=1000

downsample

String

时间维度降采样。

60m-avg

tags

Map

指定查询标签过滤,和filters冲突。

-

filters

List

过滤器,和tags冲突。

-

hint

Map

查询Hint化。

见查询Hint化说明

说明

  • 一个查询中能够包含的总的Field个数最多不超过200个。 示例如下:

    假设现有一个查询包含3个子查询,第一个子查询包含3Field,第二个子查询包括2Field,第三个子查询包含6Field,那么这个查询包含的总的Field个数totalFields=3+2+6=11,即查询时需要保证totalFields不能大于200。

  • tagsfilters都指定的场景下,后指定的过滤条件生效。

域查询信息 JSON 格式

名称

类型

是否必选

描述

默认值

举例

aggregator

String

聚合函数,详见下面的“聚合(Aggregate)说明”。

sum

field

String

域名称,”*”代表查询指标下所有域。

-

alias

String

域名称在返回结果中新名字。

-

downsample

String

时间维度降采样。

60m-avg

rate

Boolean

是否计算指定指标值的增长速率,计算公式: Vt-Vt-1/t1-t-1。

false

true

dpValue

String

根据提供条件过滤返回数据点,支持“>”、“<”、 “=”、“<=”、“>=”、 “!=”。

>=1000

where

String

当域查询信息的field指定为通配符“*”时,该字段用于指定过滤最终查询结果时针对哪个字段进行过滤。其本质与dpValue相同,都是后过滤。

f1>=100

说明

关于 limitdpValuedownsampletagsfilters的详细信息请见下面的相关说明。

查询示例

请求:POST/api/mquery请求体

{
    "start" : 1346846400,
    "end" :   1346846411,
    "msResolution" : true,
    "queries" : [
        {
            "metric" : "wind",
            "fields" : [
                {
                    "field" : "speed",
                    "aggregator" : "sum",
                    "downsample" : "2s-last",
                      "alias" : "speed_sum"
                },
                {
                    "field" : "*",
                    "aggregator" : "sum",
                    "downsample" : "2s-count",
                    "where":"speed>10"
                }
            ]
        }
    ]
}

数据分页查询(Limit 和 Offset)说明

Limit:子查询每条时间序列返回数据点的最大数目。默认值是0,代表不限制返回点数量。

Offset:子查询每条时间序列返回数据点的偏移量。默认值也是0,代表不偏移返回的数据点。

重要
  • limitoffset不能为负数。

  • limitoffset是对最后多值返回结果的分页查询处理,而不是对某一域查询结果进行处理。

示例

返回第10011500的数据点,则limit设为500,offset设为1000。

{
    "start" : 1346846400,
    "end"  :  1346846411,
    "msResolution" : true,
    "queries" : [
        {
            "metric" : "wind",
            "fields" : [
                {
                    "field" : "*",
                    "aggregator" : "sum",
                    "downsample" : "2s-count"
                }
            ],
            "filters" : [
                {
                    "filter" : "IOTE_8859_0005|IOTE_8859_0004",
                    "tagk" : "sensor",
                    "type" : "literal_or"
                }
            ],
            "limit" : 500,
            "offset" : 1000
        }
    ]
}

值过滤(dpValue) 说明

根据用户设置的数值限制条件,过滤最终的返回数据点。支持 “>”、“<”、 “=”、 “<=”、 “>=”、 “!=”。

重要

不同 fields 之间的 dpValue 关系是“或”。“和”的关系暂时不支持。

字符串仅支持“=”、“!=”。

示例

{
    "start" : 1346846400,
    "end" :   1346846411,
    "msResolution" : true,
    "queries" : [
        {
            "metric" : "wind",
            "fields" : [
                {
                    "field" : "level",
                    "aggregator" : "avg",
                    "downsample" : "2s-avg",
                    "dpValue" : ">=8.0"
                }
            ],
            "filters" : [
                {
                    "filter" : "IOTE_8859_0005|IOTE_8859_0004",
                    "tagk" : "sensor",
                    "type" : "literal_or"
                }
            ]
        }
    ]
}

差值(delta)说明

当用户在子查询中指定差值算子的时候,TSDB返回的数据的dps中的key-value对的value值将是计算所得的差值。

重要

如果未指定差值时返回的dps中有nkey-value对,那么计算完差值后返回的dps中将只包含n-1key-value对(第一个key-value对因无法求差值将被舍去)。差值算子对于Downsample后的值也同样适用。

用户指定了差值算子时,还可以进一步在子查询中指定deltaOptions来对求差值的行为进行进一步控制。当前支持的deltaOptions如下所示:

名称

类型

是否必选

描述

默认值

举例

counter

Boolean

当该标记位被指定时,则表示假定用于计算差值的指标值,被用户视作是一个类似计数器的单调递增(或递减)的累计值(服务器并不会加以检查)。

false

true

counterMax

Integer

counter被设置为true时,该值用于指定差值的阈值。当差值的绝对值超过该阈值时将被视作异常值,该值不指定时则对差值不设阈值。

100

dropReset

Boolean

该标记位需要与上述counterMax结合使用。当通过指定counterMax 后计算出了异常的差值,dropReset决定是否要直接丢弃异常的差值。若指定为true,则异常值直接被丢弃,若指定为false(默认情况),则异常值被重置为零。

false

true

示例

    {
       "start":1346046400,
       "end":1347056500,
       "queries":[
          {
             "aggregator":"none",
             "downsample":"5s-avg",
             "delta":true,
             "deltaOptions":{
                 "counter":true,
                 "counterMax":100
             }
             "metric":"sys.cpu.0",
             "dpValue":">=50",
             "tags":{
                "host":"localhost",
                "appName":"hitsdb"
             }
          }
       ]
    }

降采样(Downsample)说明

当查询的时间范围比较长,只需要返回每个时间间隔的统计值时使用。查询结果返回的时间戳是按照查询指定的间隔对齐后的时间区间起始值。查询格式如下:

<interval><units>-<aggregator>[-fill policy]
重要

指定了降采样后,查询指定的起始时间范围会自动按照指定的interval区间向前后取整对齐。例如,指定时间戳范围为[1346846401,1346846499] ,指定的interval5m,则查询真实的时间戳范围为[1346846101,1346846799]。

其中:

  • interval:指数值,如 5、60等,特殊的“0all”表示时间维度聚合为一个点。

  • units:s代表秒,m代表分,h代表小时,d代表天,n代表月,y代表年。

    说明

    • 默认按照时间戳取模对齐,即“对齐时间戳=数据时间戳-(数据时间戳 % interval)”。

    • 支持基于日历时间间隔的降采样。要使用日历界限,您需要在时间单位units后添加一个c。例如,1dc代表从当日零点到次日零点之间的 24 小时。

  • aggregator:降采样使用的算子及其说明如下表所示。

算子

描述

avg

平均值。

count

数据点数。

first

取第一个值。

last

取最后一个值。

min

最小值。

max

最大值。

sum

求和。

zimsum

求和。

rfirst

功能同first但降采样后返回的结果的时间戳是原始数据的时间戳,而非降采样对齐后的时间戳。

rlast

功能同last但降采样后返回的结果的时间戳是原始数据的时间戳,而非降采样对齐后的时间戳。

rmin

功能同min但降采样后返回的结果的时间戳是原始数据的时间戳,而非降采样对齐后的时间戳。

rmax

功能同max但降采样后返回的结果的时间戳是原始数据的时间戳,而非降采样对齐后的时间戳。

说明

当降采样的聚合算子指定为rfirstrlastrminrmax时,不能再在降采样表达式中指定fill policy

Fill policy

Fill policy即填值。降采样先把所有时间线按照指定精度切分,并把每个降采样区间内的数据做一次运算,降采样后如果某个精度区间没有值,fill policy可以指定在这个时间点填充具体的值。比如某条时间线降采样后的时间戳为:t+0,t+20,t+30,此时如果不指定fill policy,只有3个值,如果指定了fill policynull,此时间线会有4个值,其中t+10时刻的值为nullFill policy与具体填充值的对应如下表所示。

Fill Policy

填充值

none

默认行为,不填值。

nan

NaN

null

null

zero

0

linear

线性填充值。

previous

之前的一个值。

near

邻近的一个值。

after

之后的一个值。

fixed

用指定的一个固定填充值(请参照下面示例)。

Fixed Fill Policy

使用方法:将固定的填充值写到 “#”之后。填充值支持正负数。格式如下:

<interval><units>-<aggregator>-fixed#<number>

示例1h-sum-fixed#61h-avg-fixed#-8

降采样示例

示例:1m-avg1h-sum-zero1h-sum-near

重要

在域查询信息中,downsample 不是必要条款。您甚至可以在查询时明确标明其值为null或者空(""),例如:{"downsample": null} 或者 {"downsample": ""},这样就不会触发数据点降采样。但是,如果又一个域查询使用了downsample,在同一子查询下的所有域查询信息都需要包括 downsample并且采用同样的降采样区间。

聚合(Aggregate)说明

在降采样后会得到多条时间线的值,并且这些时间线的时间戳是对齐的,而聚合就是把多条时间线的值按各个对齐时刻聚合为一条时间线的结果(注意:如果只有一条时间线,则不进行聚合)。聚合时必须要求每条时间线在对应时刻都有值,如果某条时间线在某个时刻没有值,则会进行插值,插值描述如下。

重要

在域查询信息中,aggregator是必要条款,但是可以通过none来指明不做聚合运算。但是,TSDB多值模型不支持在同一个查询中有的域做聚合,有的域不做聚合。

插值

如果某条时间线某个精度区间没有值且没有使用fill policy进行填值,而待聚合的其他时间线中有一条时间线在此精度区间有值,则会对本时间线的这个缺值精度区间进行插值。

例如:降采样以及聚合条件为{"downsample": "10s-avg", "aggregator": "10s-avg", "aggregator": "sum"} ,有两条时间线需要使用 sum聚合,按10s-avg做降采样后的这两条时间线有值的时间戳分别为:

line 1:t+0,t+10,t+20,t+30、line 2:t+0,t+20,t+30。

第二条时间线 line 2 缺 “t+10” 这个时刻的值,那么在聚合前会对line 2的“t+10”这个时间点进行插值。插值的方法与聚合的算子有关,详见下面的算子列表。

算子

描述

插值方法

avg

平均值

线性插值(斜率拟合)

count

数据点数

插 0

mimmin

最小值

插最大值

mimmax

最大值

插最小值

min

最小值

线性插值

max

最大值

线性插值

none

不做计算

插 0

sum

求和

线性插值

zimsum

求和

插 0

Filters 说明

有以下两种方法可以指定filter:

  • 在指定 tagk 时指定filter:

    • tagk = *:对tagk下面的tagv做分组,相同的tagv做聚合。

    • tagk = tagv1|tagv2:分别对tagk下面的tagv1tagv2数据做聚合。

  • 使用JSON格式指定filter:

名字

类型

是否必选

描述

默认值

举例

type

String

filter 类型,详见下面说明。

literal_or

tagk

String

指定tagk名。

host

filter

String

filter表达式。

web01web02

groupBy

Boolean

是否按照tagv 做分组。

false

false

Filter 类型说明

名称

filter 举例

描述

literal_or

web01web02

分别对多个tagv做聚合,区分大小写。

wildcard

*.example.com

分别对满足通配符的tagv做聚合,区分大小写。

查询示例

包含 filter 的查询示例

请求体:

{
    "start" : 1346846400,
    "end" :   1346846411,
    "msResolution" : true,
    "queries" : [
        {
            "metric" : "wind",
            "fields" : [
                {
                    "field" : "speed",
                    "aggregator" : "none",
                    "alias" : "column_speed"
                },
                {
                      "field" : "*",
                    "aggregator" : "none",
                    "alias" : "column_"
                }
            ],
            "filters" : [
                {
                    "filter" : "IOTE_8859_0005|IOTE_8859_0004",
                    "tagk" : "sensor",
                    "type" : "literal_or"
                }
            ]
        }
    ]
}

查询结果说明

查询成功的HTTP响应码为200,响应内容为JSON格式数据。说明如下:

名称

描述

metric

指标名。

columns

查询结果对应的列的名称。

tags

tagv未做聚合的tag。

aggregateTags

tagv做了聚合的tag。

values

Tuple结构查询结果。

响应结果示例:

  • Aggregator : None场景示例

[
   {
      "metric":"wind",
      "columns":[
         "timestamp",
         "column_speed",
         "column_description",
         "column_direction",
         "column_level",
         "column_speed"
      ],
      "tags":{
         "city":"hangzhou",
         "country":"china",
         "province":"zhejiang",
         "sensor":"IOTE_8859_0005"
      },
      "aggregatedTags":[],
      "values":[
         [ 1346846406000, null, "Fresh breeze", "East", 0.5, null ],
         [ 1346846407000, null, "Fresh breeze", "South", 1.5, null ]
   },
   {
      "metric":"wind",
      "columns":[
         "timestamp",
         "column_speed",
         "column_description",
         "column_direction",
         "column_level",
         "column_speed"
      ],
      "tags":{
         "city":"hangzhou",
         "country":"china",
         "province":"zhejiang",
         "sensor":"IOTE_8859_0004"
      },
      "aggregatedTags":[],
      "values":[
         [ 1346846400000, 40.4, "Fresh breeze", "East", 0.4, 40.4 ],
         [ 1346846401000, 41.4, "Fresh breeze", "South", 1.4, 41.4 ],
         [ 1346846402000, 42.4, "Fresh breeze", "West", 2.4, 42.4 ],
         [ 1346846403000, 43.4, "Fresh breeze", "North", 3.4,43.4 ]
   }
]
  • AggregatorAvg 的场景示例(查看杭州市所有sensor监控的平均风速和平均风等级)

[
  {
    "metric": "wind",
    "columns": [
      "timestamp",
      "avg_level",
      "avg_speed"
    ],
    "tags": {
      "city": "hangzhou"
    },
    "aggregatedTags": [
      "country",
      "province",
      "sensor"
    ],
    "values": [
      [1346846400000, 0.25, 40.25],
      [1346846401000, 1.25, 41.25],
      [1346846402000, 2.5, 42.5],
      [1346846411000, 5.5, null]
    ]
  }
]

查询 Hint 化说明

场景说明

该特性主要是提高查询速度。假设某一个tags A命中的时间线明显大于其他的tags B命中的时间线,则需要舍弃,避免捞取tags A的大量时间线之后,被tags B小规模时间线交集后,结果集等于tags B。

格式说明

  • 当前版本只支持tagk级别的查询索引限制(hint下的tagk是固定写法)。

  • 其中,0表示不使用对应tagk的索引,反之1表示使用对应tagk的索引。

版本说明

v2.6.1版本开始支持hint特性。

查询示例

子查询级别

{
  "queries": [
    {
      "metric": "demo.mf",
      "tags": {
        "sensor": "IOTE_8859_0001",
        "city": "hangzhou",
        "province": "zhejiang",
        "country": "china"
      },
      "fields": [
        "speed"
      ],
      "hint": {
        "tagk": {
          "dc": 1
        }
      }
    }
  ]
}

整体查询级别

{
  "queries": [
    {
      "metric": "demo.mf",
      "tags": {
        "sensor": "IOTE_8859_0001",
        "city": "hangzhou",
        "province": "zhejiang",
        "country": "china"
      },
      "fields": [
        "speed"
      ]
    }
  ],
  "hint": {
    "tagk": {
      "dc": 1
    }
  }
}

异常情况

不可同时指定 0 和 1

{
  "start": 1346846400,
  "end": 1346846400,
  "queries": [
    {
      "aggregator": "none",
      "metric": "sys.cpu.nice",
      "tags": {
        "dc": "lga",
        "host": "web01"
      }
    }
  ],
  "hint": {
    "tagk": {
      "dc": 1,
      "host": 0
    }
  }
}

会返回如下报错信息:

{
    "error": {
        "code": 400,
        "message": "The value of hint should only be 0 or 1, and there should not be both 0 and 1",
        "details": "TSQuery(start_time=1346846400, end_time=1346846400, subQueries[TSSubQuery(metric=sys.cpu.nice, filters=[filter_name=literal_or, tagk=dc, literals=[lga], group_by=true, filter_name=literal_or, tagk=host, literals=[web01], group_by=true], tsuids=[], agg=none, downsample=null, ds_interval=0, rate=false, rate_options=null, delta=false, delta_options=null, top=0, granularity=null, granularityDownsample=null, explicit_tags=explicit_tags, index=0, realTimeSeconds=-1, useData=auto, limit=0, offset=0, dpValue=null, preDpValue=null, startTime=1346846400000, endTime=1346846400000, Query_ID=null)] padding=false, no_annotations=false, with_global_annotations=false, show_tsuids=false, ms_resolution=false, options=[])"
    }
}

不可指定除了 0 和 1 之外的值

{
  "start": 1346846400,
  "end": 1346846400,
  "queries": [
    {
      "aggregator": "none",
      "metric": "sys.cpu.nice",
      "tags": {
        "dc": "lga",
        "host": "web01"
      }
    }
  ],
  "hint": {
    "tagk": {
      "dc": 100
    }
  }
}

会返回如下报错信息:

{
    "error": {
        "code": 400,
        "message": "The value of hint can only be 0 or 1, and it is detected that '100' is passed in",
        "details": "TSQuery(start_time=1346846400, end_time=1346846400, subQueries[TSSubQuery(metric=sys.cpu.nice, filters=[filter_name=literal_or, tagk=dc, literals=[lga], group_by=true, filter_name=literal_or, tagk=host, literals=[web01], group_by=true], tsuids=[], agg=none, downsample=null, ds_interval=0, rate=false, rate_options=null, delta=false, delta_options=null, top=0, granularity=null, granularityDownsample=null, explicit_tags=explicit_tags, index=0, realTimeSeconds=-1, useData=auto, limit=0, offset=0, dpValue=null, preDpValue=null, startTime=1346846400000, endTime=1346846400000, Query_ID=null)] padding=false, no_annotations=false, with_global_annotations=false, show_tsuids=false, ms_resolution=false, options=[])"
    }
}