全部产品

Phoenix 入门

更新时间:2017-06-07 13:26:11   分享:   

Phoenix 数据分析入门

本篇介绍简单的Phoenix使用方法,进行初步的数据分析。

在开始之前,请先确认您已经准备好了Phoenix的运行环境,若还没有,请参考这里

快速开始

  1. 创建一个 us_population.sql 文件,用来创建表结构,内容如下
    1. CREATE TABLE IF NOT EXISTS us_population (
    2. state CHAR(2) NOT NULL,
    3. city VARCHAR NOT NULL,
    4. population BIGINT
    5. CONSTRAINT my_pk PRIMARY KEY (state, city));
  2. 准备分析用数据

    这里我们直接创建一份数据, 创建一个文件 us_population.csv,内容如下

    1. NY,New York,8143197
    2. CA,Los Angeles,3844829
    3. IL,Chicago,2842518
    4. TX,Houston,2016582
    5. PA,Philadelphia,1463281
    6. AZ,Phoenix,1461575
    7. TX,San Antonio,1256509
    8. CA,San Diego,1255540
    9. TX,Dallas,1213825
    10. CA,San Jose,912332
  3. 准备分析用的sql 创建数据分析用sql,us_population_queries.sql,内容如下
    1. SELECT state as "State",count(city) as "City Count",sum(population) as "Population Sum"
    2. FROM us_population
    3. GROUP BY state
    4. ORDER BY sum(population) DESC;
  4. 执行分析 现在我们执行如下的语句来进行分析
    1. ./psql.py <your_zookeeper_quorum> us_population.sql us_population.csv us_population_queries.sql
    将其中的ZooKeeper的地址替换成我们的ZooKeeper的地址,类似zk1,zk2,zk3
  5. 结果验证

    成功运行后会看到类似如下的结果 result

本文导读目录
本文导读目录
以上内容是否对您有帮助?