如果您是MaxCompute初学者

如果您是初学者,建议您从如下模块开始读起:

  • 产品简介: MaxCompute产品的总体介绍以及包含的主要功能。通过阅读该章节,您会对MaxCompute有一个总体的认识。
  • 快速开始:通过示例,指导您如何进行申请账号、安装客户端、创建表、授权、导入导出数据、运行SQL任务、运行UDF/Mapreduce程序等操作。
  • 基本介绍:MaxCompute的基本概念及常用命令介绍。您可以进一步熟悉如何操作MaxCompute。
  • 工具:在分析数据之前,您需要掌握MaxCompute常用工具的下载、配置以及使用方法。

    我们为您提供工具,您可以通过此工具对MaxCompute进行操作。

建议您熟悉以上的模块后,再有针对性地对其他模块进行深入学习。

如果您是数据分析师

如果您是数据分析师,建议您熟读SQL模块的内容。

  • SQL:您可以查询并分析存储在MaxCompute上的大规模数据。包含的主要功能如下:
    • 支持DDL语句,您可以通过Create、Drop和Alter对表和分区进行管理。
    • 您可以通过Select选择表中的某几条记录,通过Where语句查看满足条件的记录,实现过滤功能。
    • 您可以通过等值连接Join实现两张表的关联。
    • 您可以通过对某些列Group By,实现聚合操作。
    • 您可以通过Insert overwrite/into把结果记录插入到另一张表中。
    • 您可以通过内置函数和自定义函数(UDF)来实现一系列的计算。

如果您拥有一定开发经验

如果您拥有一定的开发经验,了解分布式概念,并且某些数据分析可能无法用SQL来实现,此时推荐您学习MaxCompute更高级的功能模块。如下所示:

  • MapReduce:MaxCompute提供的Java MapReduce编程模型。您可以使用MapReduce提供的接口(Java API)编写MapReduce程序,处理MaxCompute中的数据。
  • Graph:一套面向迭代的图计算处理框架。使用图进行建模,图由点(Vertex)和边(Edge)组成,点和边包含权值(Value)。通过迭代对图进行编辑、演化,最终得出结果。
  • Eclipse Plugin:方便您使用MapReduce、UDF以及Graph的Java SDK进行开发工作。
  • Tunnel:您可以使用Tunnel服务向MaxCompute批量上传离线数据或者从MaxCompute下载离线数据。
  • SDK:
    • Java SDK:向开发者提供Java接口。
    • Python SDK:向开发者提供Python接口。
    说明
    目前MapReduce以及Graph功能仍处于公测中,若您想使用这部分功能,可以通过工单系统提交申请。申请时请指明您的项目空间名称,我们会在7个工作日内处理。

如果您是项目Owner或者管理员

如果您是一个项目空间的Owner或者管理员,您需要熟知以下模块:

  • 安全指南:您可以通过阅读该章节,了解如何进行给用户授权、跨项目空间的资源共享、设置项目空间的数据保护功能、policy授权等操作。
  • MaxCompute收费指南:介绍MaxCompute的收费模式。
  • 部分只有项目空间Owner才能使用的命令,例如常用命令其他操作SetProject操作。