E-MapReduce的JOIN和传统批处理JOIN的语义一致,都用于将两张表关联起来。

语法

tableReference [, tableReference ]* | tableexpression
[ joinType ] JOIN tableexpression [ joinCondition ];
参数描述如下:
  • tableReference:表名称。
  • tableexpression:表达式。
  • joinCondition:JOIN条件。

约束

当执行流数据的JOIN操作时,部分JOIN类型是不支持的,具体请参见Spark官方文档说明
左表 右表 JOIN类型 是否支持
流式表 静态表 内连接 支持
左连接 支持
右连接 不支持
全连接 不支持
静态表 流式表 内连接 支持
左连接 不支持
右连接 支持
全连接 不支持
流式表 流式表 内连接 支持
左连接 支持
右连接 支持
全连接 不支持