全部产品
云市场

RCFILE

更新时间:2019-12-10 20:15:14

本文以nation.tbl为例,详细为您介绍如何将普通文本文件转换成RCFile格式的文件。

RCF原文件

操作步骤

  1. 创建OSS Schema。

    1. CREATE SCHEMA dla_oss_db with DBPROPERTIES(
    2. catalog='oss',
    3. location 'oss://bucket-name/TPC-H/'
    4. )
  2. 在DLA中创建nation_txt表,LOCATION为OSS中nation.tbl的路径。

    1. CREATE EXTERNAL TABLE nation_txt(
    2. n_nationkey int,
    3. n_name string,
    4. n_id string,
    5. n_regionkey int,
    6. n_comment string
    7. )
    8. ROW FORMAT DELIMITED
    9. FIELDS TERMINATED BY '|'
    10. STORED AS TEXTFILE
    11. LOCATION 'oss://bucket-name/TPC-H/nation/nation.tbl'
  3. 在DLA中创建目标表nation_RCFile,LOCATION设置为OSS中的您需要的位置。

    目标路径

    注意:LOCATION必须是OSS中已经存在的目录,以/结尾。

    1. CREATE EXTERNAL TABLE nation_RCFile(
    2. n_nationkey int,
    3. n_name string,
    4. n_id string,
    5. n_regionkey int,
    6. n_comment string
    7. )
    8. ROW FORMAT DELIMITED
    9. FIELDS TERMINATED BY '|'
    10. STORED AS RCFile
    11. LOCATION 'oss://bucket-name/TPC-H/nation_RCFile/'

    STORED AS RCFile:指定文件的存储格式为RCFile。

  4. 执行INSERT...SELECT语句,将nation_txt表中的数据插入nation_RCFile表中。

    1. INSERT INTO nation_RCFile SELECT * FROM nation_txt;
  5. 查看nation_RCFile数据。

    INSERT...SELECT语句执行成功后,在OSS中查看生成的RCFile数据文件。

    转换格式后的数据