本文介绍如何使用PyODPS读写MaxCompute表数据。

PyODPS

您可以使用PyODPS与MaxCompute或PAI-Studio中的数据进行通信。PyODPS是阿里云提供的Python SDK,详情请参见PyODPS开发文档

  1. 安装PyODPS。
    在PAI-DSW的Terminal中,执行如下命令。
    pip install --user pyodps
  2. 读取MaxCompute表数据(以MaxCompute特定项目下的某表前10行数据为例)。
    from odps import ODPS
    from odps.df import DataFrame
    o = ODPS('<your_AccessKey_ID>', '<your_AccessKey_Secret>',project='<your_MaxCompute_project>', endpoint='http://service-all.ext.odps.aliyun-inc.com/api')
    users = DataFrame(o.get_table('<your_table_name>'))
    print(users.head(10))
    需要根据实际情况修改以下参数。
    参数 描述
    <your_AccessKey_ID> 阿里云的AccessKey ID。
    <your_AccessKey_Secret> 阿里云的AccessKey Secret。
    <your_MaxCompute_project> MaxCompute项目名称。
    http://service-all.ext.odps.aliyun-inc.com/api 华东2(上海)GPU M40实例和华北2(北京)预付费P100实例的Endpoint。其他地域的Endpoint为http://service.cn.maxcompute.aliyun.com/api
    <your_table_name> MaxCompute表名。