前提条件

您必须完成以下操作:

背景信息

PyODPS是MaxCompute Python版本的SDK, 它提供了对MaxCompute对象的基本操作,并提供了DataFrame框架,您可以在MaxCompute上进行数据分析。

编写PyODPS脚本

  1. 右键单击scripts,选择New > MaxCompute PyODPS
  2. 在弹出的对话框中填写Name ,并选择KindPyODPS Script
  3. 新建成功后,模版默认通过PyODPS初始化odpso这两个对象。您可以在编辑器里直接开发PyODPS脚本。

测试PyODPS脚本

编写完成后,需要测试代码是否符合预期。MaxCompute Studio支持本地测试,即下载表的部分示例数据在本地运行并进行调试。

  1. 右键单击已经编辑完成的Python脚本,选择RUN
  2. Edit configuration页面,配置相关参数,单击OK
    **
    • MaxCompute project:脚本运行使用的MaxCompute空间。本地运行时选择local
    • MaxCompute table:脚本运行时需要使用的MaxCompute表的名称。
    • Table columns:脚本运行时需要使用的MaxCompute表的列信息。
    • Download Record limit:下载数据记录限制。默认为100条。
    说明
    • 如果已经下载数据,则不会再次重复下载。如果需要再次下载,请在MaxCompute客户端使用Tunnel命令下载数据。
    • 默认下载100条数据,如果需要更多数据测试,请在MaxCompute客户端使用Tunnel命令或者MaxCompute Studio的表下载功能下载数据。
    • 下载完成后,您可以在warehouse目录下该表的data文件中看到下载的示例数据。
    • 本地运行框架会根据您指定的列,获取data文件中指定列的数据,本地运行PyODPS脚本。
  3. 您可以在控制台查看打印结果。