Python SDK示例:Configuration

本文为您介绍Python SDK中Configuration相关的典型场景操作示例。

Configuration

PyODPS提供了一系列的配置选项,可通过odps.options命令获得。可配置的MaxCompute选项,如下所示:

  • 通用配置

    选项

    说明

    默认值

    end_point

    MaxCompute Endpoint

    None

    default_project

    默认项目空间

    None

    log_view_host

    Logview主机名

    None

    log_view_hours

    Logview保持时间(小时)

    24

    local_timezone

    使用的时区。True表示本地时间,False表示UTC,也可用pytz时区

    None

    lifecycle

    所有表生命周期

    None

    temp_lifecycle

    临时表生命周期

    1

    biz_id

    用户ID

    None

    verbose

    是否打印日志

    False

    verbose_log

    日志接收器

    None

    chunk_size

    写入缓冲区大小

    1496

    retry_times

    请求重试次数

    4

    pool_connections

    缓存在连接池的连接数

    10

    pool_maxsize

    连接池最大容量

    10

    connect_timeout

    连接超时

    5

    read_timeout

    读取超时

    120

    completion_size

    对象补全列举条数限制

    10

    notebook_repr_widget

    使用交互式图表

    True

    sql.settings

    MaxCompute SQL运行全局hints

    None

    sql.use_odps2_extension

    启用MaxCompute 2.0语言扩展

    False

  • 数据上传或下载配置

    选项

    说明

    默认值

    tunnel.endpoint

    Tunnel Endpoint

    None

    tunnel.use_instance_tunnel

    使用Instance Tunnel获取执行结果

    True

    tunnel.limited_instance_tunnel

    限制Instance Tunnel获取结果的条数

    True

    tunnel.string_as_binary

    在STRING类型中使用Bytes而非Unicode

    False

  • DataFrame配置

    选项

    说明

    默认值

    interactive

    是否在交互式环境

    根据检测值

    df.analyze

    是否启用非MaxCompute内置函数

    True

    df.optimize

    是否开启DataFrame全部优化

    True

    df.optimizes.pp

    是否开启DataFrame谓词下推优化

    True

    df.optimizes.cp

    是否开启DataFrame列剪裁优化

    True

    df.optimizes.tunnel

    是否开启DataFrame使用Tunnel优化执行

    True

    df.quote

    MaxCompute SQL后端是否用``来标记字段和表名

    True

    df.libraries

    DataFrame运行使用的第三方库(资源名)

    None