本文为您介绍Python SDK中Configuration相关的典型场景操作示例。
Configuration
PyODPS提供了一系列的配置选项,可通过odps.options
命令获得。可配置的MaxCompute选项,如下所示:
通用配置
选项
说明
默认值
end_point
MaxCompute Endpoint
None
default_project
默认项目空间
None
log_view_host
Logview主机名
None
log_view_hours
Logview保持时间(小时)
24
local_timezone
使用的时区。True表示本地时间,False表示UTC,也可用pytz时区
None
lifecycle
所有表生命周期
None
temp_lifecycle
临时表生命周期
1
biz_id
用户ID
None
verbose
是否打印日志
False
verbose_log
日志接收器
None
chunk_size
写入缓冲区大小
1496
retry_times
请求重试次数
4
pool_connections
缓存在连接池的连接数
10
pool_maxsize
连接池最大容量
10
connect_timeout
连接超时
5
read_timeout
读取超时
120
completion_size
对象补全列举条数限制
10
notebook_repr_widget
使用交互式图表
True
sql.settings
MaxCompute SQL运行全局hints
None
sql.use_odps2_extension
启用MaxCompute 2.0语言扩展
False
数据上传或下载配置
选项
说明
默认值
tunnel.endpoint
Tunnel Endpoint
None
tunnel.use_instance_tunnel
使用Instance Tunnel获取执行结果
True
tunnel.limited_instance_tunnel
限制Instance Tunnel获取结果的条数
True
tunnel.string_as_binary
在STRING类型中使用Bytes而非Unicode
False
DataFrame配置
选项
说明
默认值
interactive
是否在交互式环境
根据检测值
df.analyze
是否启用非MaxCompute内置函数
True
df.optimize
是否开启DataFrame全部优化
True
df.optimizes.pp
是否开启DataFrame谓词下推优化
True
df.optimizes.cp
是否开启DataFrame列剪裁优化
True
df.optimizes.tunnel
是否开启DataFrame使用Tunnel优化执行
True
df.quote
MaxCompute SQL后端是否用``来标记字段和表名
True
df.libraries
DataFrame运行使用的第三方库(资源名)
None