全部产品
云市场

ORC

更新时间:2019-07-30 10:01:26

本文介绍如何在DLA中为ORC类型的文件创建表。

ORC(Optimized Row Columnar)是Apache开源项目Hive支持的一种经过优化的列存储文件格式,与CSV文件相比,ORC文件不仅节省存储空间,而且数据查询性能更高。

前提条件

请参见文档文件格式转换,准备测试数据。

操作步骤

  1. 创建OSS Schema。

    1. CREATE SCHEMA dla_oss_db with DBPROPERTIES(
    2. catalog='oss',
    3. location 'oss://dlaossfile1/dla/'
    4. )
  2. 创建ORC文件表。

    1. CREATE EXTERNAL TABLE orders_orc_date (
    2. O_ORDERKEY INT,
    3. O_CUSTKEY INT,
    4. O_ORDERSTATUS STRING,
    5. O_TOTALPRICE DOUBLE,
    6. O_ORDERDATE DATE,
    7. O_ORDERPRIORITY STRING,
    8. O_CLERK STRING,
    9. O_SHIPPRIORITY INT,
    10. O_COMMENT STRING
    11. )
    12. STORED AS ORC
    13. LOCATION 'oss://dlaossfile1/TPC-H/orders_orc/'

    STORED AS ORC:指定文件格式为ORC。

  3. 查看ORC文件数据。

    1. SELECT * FROM orders_orc_date

    orc