使用多元索引查询数据时,通过预先定义排序方式或者查询时指定排序方式,您可以按照指定排列方式获取到返回数据。当返回结果行数较多时,通过使用跳转翻页或者连续翻页可以快速定位到所需数据。
使用场景
分类 | 使用方式 | 功能 | 使用场景 |
---|---|---|---|
排序 | 创建时指定排序方式 | IndexSort(索引预排序) | 多元索引默认按照设置的索引预排序(IndexSort)方式进行排序,用于确定数据的默认返回顺序。 |
查询时指定排序方式 | ScoreSort (分数排序) | 按照查询结果的相关性(BM25算法)分数进行排序,适用于有相关性的场景,例如全文检索等。 | |
PrimaryKeySort(主键排序) | 按照主键进行排序,适用于按照事物标识排序的场景。 | ||
FieldSort(字段值排序) | 按照字段值进行排序,适用于电商、社交媒资等按照事物属性排序的场景,例如商品销量、浏览量等。 | ||
GeoDistanceSort(地理位置排序) | 根据地理点距离进行排序,适用于地图、物流等按照距离排序事物的场景,例如某个位置周边餐厅按距离排序等。 | ||
翻页 | 查询时指定翻页方式 | 使用limit和offser翻页 | 返回结果行数小于50000行时用于跳转翻页。 |
使用token翻页 | 用于连续翻页,默认只能向后翻页。由于在一次查询的翻页过程中token长期有效,您可以通过缓存并使用之前的token实现向前翻页。 |
索引预排序
多元索引默认按照设置的索引预排序(IndexSort)方式进行排序,使用多元索引查询数据时,IndexSort决定了数据的默认返回顺序。
在创建多元索引时,您可以自定义IndexSort,如果未自定义IndexSort,则IndexSort默认为主键排序。
- 索引预排序只支持PrimaryKeySort (按照主键排序)和FieldSort(按照字段值排序)两种方式。
- 含有Nested类型字段的多元索引不支持索引预排序。
查询时排序
只有enable_sort_and_agg设置为true的字段才能进行排序。
在每次查询时,可以指定排序方式,多元索引支持如下四种排序方式(Sorter)。您也可以使用多个Sorter,实现先按照某种方式排序,再按照另一种方式排序的需求。
ScoreSort
'sort' => array(
array(
'score_sort' => array(
'order' => SortOrderConst::SORT_ORDER_DESC
)
),
)
PrimaryKeySort
按照主键进行排序。
'sort' => array(
array(
'pk_sort' => array(
'order' => SortOrderConst::SORT_ORDER_ASC
)
),
)
FieldSort
按照某列的值进行排序。
'sort' => array(
array(
'field_sort' => array(
'field_name' => 'keyword',
'order' => SortOrderConst::SORT_ORDER_ASC,
'mode' => SortModeConst::SORT_MODE_AVG,
)
),
)
GeoDistanceSort
根据地理点距离进行排序。
'sort' => array(
array(
'geo_distance_sort' => array(
'field_name' => 'geo',
'order' => SortOrderConst::SORT_ORDER_ASC,
'distance_type' => GeoDistanceTypeConst::GEO_DISTANCE_PLANE,
'points' => array('0.6,0.6')
)
),
)
多类型组合排序
先按照某列进行排序,再按照另一列进行排序。
'sort' => array(
array(
'field_sort' => array(
'field_name' => 'keyword',
'order' => SortOrderConst::SORT_ORDER_ASC,
'mode' => SortModeConst::SORT_MODE_AVG,
)
),
array(
'pk_sort' => array(
'order' => SortOrderConst::SORT_ORDER_ASC
)
),
)
翻页方式
在获取返回结果时,可以使用limit和offset或者使用token进行翻页。
使用limit和offset翻页
如果使用此方式进行翻页时未设置limit和offset,则limit的默认值为10,offset的默认值为0。
$request = array(
'table_name' => 'php_sdk_test',
'index_name' => 'php_sdk_test_search_index',
'search_query' => array(
'offset' => 10,
'limit' => 10,
'get_total_count' => true,
'query' => array(
'query_type' => QueryTypeConst::MATCH_ALL_QUERY
),
'sort' => array(
array(
'field_sort' => array(
'field_name' => 'keyword',
'order' => SortOrderConst::SORT_ORDER_ASC
)
),
),
'token' => null,
),
'columns_to_get' => array(
'return_type' => ColumnReturnTypeConst::RETURN_SPECIFIED,
'return_names' => array('col1', 'col2')
)
);
$response = $otsClient->search($request);
使用token翻页
由于使用token进行翻页时翻页深度无限制,当需要进行深度翻页时,推荐使用token进行翻页。
当符合查询条件的数据未读取完时,服务端会返回next_token,此时可以使用next_token继续读取后面的数据。
使用token进行翻页时默认只能向后翻页。由于在一次查询的翻页过程中token长期有效,您可以通过缓存并使用之前的token实现向前翻页。
使用token翻页后的排序方式和上一次请求的一致,无论是系统默认使用IndexSort还是自定义排序,因此设置了token不能再设置Sort。另外使用token后不能设置offset,只能依次往后读取,即无法跳页。
$request = array(
'table_name' => 'php_sdk_test',
'index_name' => 'php_sdk_test_search_index',
'search_query' => array(
'offset' => 0,
'limit' => 10,
'get_total_count' => true,
'query' => array(
'query_type' => QueryTypeConst::FUNCTION_SCORE_QUERY,
'query' => array(
'query' => array(
'query_type' => QueryTypeConst::TERM_QUERY,
'query' => array(
'field_name' => 'keyword',
'term' => 'keyword'
)
),
'field_value_factor' => array(
'field_name' => 'long'
)
)
),
'sort' => array(
array(
'score_sort' => array(
'order' => SortOrderConst::SORT_ORDER_DESC
)
),
)
),
'columns_to_get' => array(
'return_type' => ColumnReturnTypeConst::RETURN_SPECIFIED,
'return_names' => array('keyword', 'long')
)
);
$response = $otsClient->search($request);
print "total_hits: " . $response['total_hits'] . "\n";
print json_encode($response['rows'], JSON_PRETTY_PRINT);
while($response['next_token'] != null) {
$request['search_query']['token'] = $response['next_token'];
$request['search_query']['sort'] = null;//当有next_token时,不能再设置Sort,token中包含sort信息。
$response = $otsClient->search($request);
print json_encode($response['rows'], JSON_PRETTY_PRINT);
}