CORR 是 MaxCompute 2.0 提供的扩展函数,用于计算两列数据的皮尔逊相关系数(Pearson Correlation Coefficient)。
命令格式
double corr(<col1>, <col2>)参数说明
col1、col2:必填。指定用于计算皮尔逊相关系数的两列数据,支持多种数值类型(DOUBLE、BIGINT、INT、SMALLINT、TINYINT、FLOAT、DECIMAL),且允许两列类型不同。
返回值说明
返回DOUBLE类型。如果某一输入列的某一行存在NULL值,则该行不参与计算。
示例数据
为便于理解各函数的使用方法,本文为您提供源数据,基于源数据提供函数相关示例。创建表mf_math_fun_t,并添加数据,命令示例如下。
CREATE TABLE IF NOT EXISTS mf_math_fun_t(
int_data INT,
bigint_data BIGINT,
double_data DOUBLE,
decimal_data DECIMAL,
float_data FLOAT,
string_data STRING
);
INSERT INTO mf_math_fun_t VALUES
(null, -10, 0.525, 0.525BD, CAST(0.525 AS FLOAT), '10'),
(-20, null, -0.1, -0.1BD, CAST(-0.1 AS FLOAT), '-10'),
(0, -1, null, 20.45BD, CAST(-1 AS FLOAT), '30'),
(-40, 4, 0.89, null, CAST(0.89 AS FLOAT), '-30'),
(5, -50, -1, -1BD, null, '50'),
(-60, 6, 1.5, 1.5BD, CAST(1.5 AS FLOAT), '-50'),
(-1, -70, -7.5, -7.5BD, CAST(-7.5 AS FLOAT),null ),
(-80, 1, -10.2, -10.2BD, CAST(-10.2 AS FLOAT), '-1' ),
(9, -90, 2.58, 2.58BD, CAST(2.58 AS FLOAT), '0'),
(-100, 10, -5.8, -5.8BD, CAST(-5.8 AS FLOAT), '-90');查询表mf_math_fun_t中的数据,命令示例如下:
SELECT * FROM mf_math_fun_t;
--返回结果。
+------------+-------------+-------------+--------------+------------+-------------+
| int_data | bigint_data | double_data | decimal_data | float_data | string_data |
+------------+-------------+-------------+--------------+------------+-------------+
| NULL | -10 | 0.525 | 0.525 | 0.525 | 10 |
| -20 | NULL | -0.1 | -0.1 | -0.1 | -10 |
| 0 | -1 | NULL | 20.45 | -1.0 | 30 |
| -40 | 4 | 0.89 | NULL | 0.89 | -30 |
| 5 | -50 | -1.0 | -1 | NULL | 50 |
| -60 | 6 | 1.5 | 1.5 | 1.5 | -50 |
| -1 | -70 | -7.5 | -7.5 | -7.5 | NULL |
| -80 | 1 | -10.2 | -10.2 | -10.2 | -1 |
| 9 | -90 | 2.58 | 2.58 | 2.58 | 0 |
| -100 | 10 | -5.8 | -5.8 | -5.8 | -90 |
+------------+-------------+-------------+--------------+------------+-------------+使用示例
基于示例数据,计算double_data和float_data两列的皮尔逊系数,命令示例如下。
select corr(double_data,float_data) from mf_math_fun_t;示例返回结果为1.0。
相关函数
CORR函数属于数学函数,更多数据计算、数据转换的相关函数请参见数学函数。
该文章对您有帮助吗?