HBase原生提供Java API进行数据访问管理,本文介绍Java API的基本使用示例。

准备工作

有关Java API的更多内容请参考Apache HBase API 手册
说明 通过配置conf创建Connection,HBase标准版和HBase增强版配置方式不同,具体请参考上面的链接。
// 创建 HBase连接,在程序生命周期内只需创建一次,该连接线程安全,可以共享给所有线程使用。
// 在程序结束后,需要将Connection对象关闭,否则会造成连接泄露。
// 也可以采用try finally方式防止泄露
Connection connection = ConnectionFactory.createConnection(conf);

使用API示例

建立完连接后,即可使用Java API访问HBase增强版集群。下面提供一些简单的Java 示例。

DDL操作

try (Admin admin = connection.getAdmin()){
    // 建表
    HTableDescriptor htd = new HTableDescriptor(TableName.valueOf("tablename"));
    htd.addFamily(new HColumnDescriptor(Bytes.toBytes("family")));
    // 创建一个只有一个分区的表
    // 在生产上建表时建议根据数据特点预先分区
    admin.createTable(htd);

    // disable 表
    admin.disableTable(TableName.valueOf("tablename"));

    // truncate 表
    admin.truncateTable(TableName.valueOf("tablename"), true);

    // 删除表
    admin.deleteTable(TableName.valueOf("tablename"));
}

DML操作

//Table 为非线程安全对象,每个线程在对Table操作时,都必须从Connection中获取相应的Table对象
try (Table table = connection.getTable(TableName.valueOf("tablename"))) {
    // 插入数据
    Put put = new Put(Bytes.toBytes("row"));
    put.addColumn(Bytes.toBytes("family"), Bytes.toBytes("qualifier"), Bytes.toBytes("value"));
    table.put(put);

    // 单行读取
    Get get = new Get(Bytes.toBytes("row"));
    Result res = table.get(get);

    // 删除一行数据
    Delete delete = new Delete(Bytes.toBytes("row"));
    table.delete(delete);

    // scan 范围数据
    Scan scan = new Scan(Bytes.toBytes("startRow"), Bytes.toBytes("endRow"));
    ResultScanner scanner = table.getScanner(scan);
    for (Result result : scanner) {
        // 处理查询结果result
        // ...
    }
    scanner.close();
}