Hive基础操作

本文介绍如何通过Hive在E-MapReduce集群上创建库和表等操作。

前提条件

已创建集群,且选择了Hive服务,详情请参见创建集群

进入Hive命令行

  1. 使用SSH方式登录集群,详情请参见登录集群

  2. 执行以下命令,切换为hadoop用户。

    su - hadoop
  3. 执行以下命令,进入Hive命令行。

    hive

库操作

本文示例中的数据库以testdb为例介绍。

  1. 创建库

    create database if not exists testdb;

    当返回信息包含OK时,表示创建库testdb成功。

  2. 查看库

    desc database testdb;
  3. 使用数据库

    use testdb;
  4. 删除库

    drop database if exists testdb;

    当返回信息包含OK时,表示删除库成功。

表操作

本文示例中的表以t为例介绍。

  1. 创建表

    create table if not exists t (id bigint, value string);

    当返回信息包含OK时,表示创建表t成功。

  2. 查看表信息

    desc formatted t;
  3. 查看所有表

    show tables;

    返回信息如下所示。

    OK
    t
  4. 删除表

    drop table if exists t;

    当返回信息包含OK时,表示删除表成功。

SQL操作

  1. 插入记录

    insert into table t select 1, 'value-1';

    当返回信息包含OK时,表示插入信息成功。

    OK
    Time taken: 14.73 seconds
  2. 查询表中的前10条信息

    select * from t limit 10;

    返回信息如下所示。

    OK
    1       value-1
    Time taken: 11.48 seconds, Fetched: 1 row(s)
  3. 聚合操作

    select value, count(id) from t group by value;

    返回信息如下所示。

    OK
    value-1 1
    Time taken: 20.11 seconds, Fetched: 1 row(s)