如何配置Hive类型作业_开源大数据平台 E-MapReduce(EMR)-阿里云帮助中心

E-MapReduce默认提供了Hive环境，您可以直接使用Hive来创建和操作创建的表和数据。

前提条件

已创建好项目，详情请参见项目管理。

已准备好Hive SQL的脚本，并上传到OSS的某个目录中（例如oss://path/to/uservisits_aggre_hdfs.hive）。

uservisits_aggre_hdfs.hive内容如下。

USE DEFAULT;
 DROP TABLE uservisits;
 CREATE EXTERNAL TABLE IF NOT EXISTS uservisits (sourceIP STRING,destURL STRING,visitDate STRING,adRevenue DOUBLE,userAgent STRING,countryCode STRING,languageCode STRING,searchWord STRING,duration INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS SEQUENCEFILE LOCATION '/HiBench/Aggregation/Input/uservisits';
 DROP TABLE uservisits_aggre;
 CREATE EXTERNAL TABLE IF NOT EXISTS uservisits_aggre (sourceIP STRING, sumAdRevenue DOUBLE) STORED AS SEQUENCEFILE LOCATION '/HiBench/Aggregation/Output/uservisits_aggre';
 INSERT OVERWRITE TABLE uservisits_aggre SELECT sourceIP, SUM(adRevenue) FROM uservisits GROUP BY sourceIP;

操作步骤

进入数据开发的项目列表页面。
1. 通过阿里云账号登录阿里云E-MapReduce控制台。
2. 在顶部菜单栏处，根据实际情况选择地域和资源组。
3. 单击上方的数据开发页签。
单击待编辑项目所在行的作业编辑。
新建Hive类型作业。
1. 在页面左侧，在需要操作的文件夹上单击右键，选择新建作业。
2. 在新建作业对话框中，输入作业名称和作业描述，从作业类型下拉列表中选择Hive作业类型。
  表示创建的作业是一个Hive作业。这种类型的作业，实际是通过以下方式提交Hive作业运行。
```
hive [user provided parameters]
```
3. 单击确定。
编辑作业内容。
1. 在作业内容中，填写提交该作业需要提供的命令行参数。
  例如，如果需要使用刚刚上传到OSS的Hive脚本，则填写的内容如下。
```
-f ossref://path/to/uservisits_aggre_hdfs.hive
```
  说明 path为uservisits_aggre_hdfs.hive在OSS上的路径。
  
  您也可以单击下方的+插入OSS路径，从OSS中进行浏览和选择，系统会自动补齐OSS上Hive脚本的路径。请务必将Hive脚本的前缀修改为OSSREF，以保证E-MapReduce可以正确下载该文件。
2. 单击保存，作业内容编辑完成。