本文以导入On Time数据集至clickhouse_demo数据库的分布式表ontime_local_distributed为例,介绍如何使用客户端clickhouse-client工具导入数据到云数据库ClickHouse。
操作步骤
- 单击On Time Data下载On Time数据集。
- 解压下载的On Time数据集。
- 连接云数据库ClickHouse集群并导入数据到云数据库ClickHouse。
在clickhouse-client客户端的安装目录下执行如下命令。
./clickhouse-client --host=<host> --port=<port> --user=<user> --password=<password> --query="INSERT INTO <ClickHouse_table> FORMAT CSVWithNames" < ontime-data.csv
参数说明如下。
参数 |
说明 |
host |
外网地址或VPC地址,您可以在集群信息页面,单击集群计算组操作列的查看连接查看。
如果clickhouse-client所在服务器与云数据库ClickHouse集群在同一VPC内,您可以使用VPC地址。否则,请使用外网地址。
|
port |
TCP端口号,您可以在集群信息页面,单击集群计算组操作列的查看连接查看。
|
user |
您通过云数据库ClickHouse控制台创建的数据库账号。
|
password |
数据库账号对应的密码。 |
ClickHouse_table |
要导入数据的云数据库ClickHouse表。
|
示例语句如下。
./clickhouse-client --host=vw-uf632p11n08is****.public.clickhouse.ads.aliyuncs.com --port=9000 --user=test --password=123456Aa --query="INSERT INTO clickhouse_demo.ontime_local_distributed FORMAT CSVWithNames" < ontime-data.csv
- 查询数据,验证数据是否导入成功。
SELECT OriginCityName, count(*) AS flights
FROM ontime_local_distributed
GROUP BY OriginCityName
ORDER BY flights DESC
LIMIT 10;
查询结果如下。
OriginCityName │ flights
──────────────────────│────────
Chicago, IL │ 24114
Atlanta, GA │ 22001
Dallas/Fort Worth, TX │ 17340
Los Angeles, CA │ 14494
Denver, CO │ 14170
New York, NY │ 14075
Washington, DC │ 11985
Houston, TX │ 11483
San Francisco, CA │ 11259
St. Louis, MO │ 10721