本文为您介绍PyODPS提供的配置选项。

您可以通过odps.options获得PyODPS提供的配置选项。
from odps import options
# 设置所有输出表的生命周期(lifecycle选项)。
options.lifecycle = 30
# 使用Tunnel下载string类型时使用bytes(tunnel.string_as_binary选项)。
options.tunnel.string_as_binary = True
# 用ODPS执行PyODPS DataFrame时,可以参照下面dataframe相关配置,在sort时将limit设置为一个比较大的值。
options.df.odps.sort.limit = 100000000

通用配置

选项 说明 默认值
end_point ODPS Endpoint。 None
default_project 默认Project。 None
log_view_host LogView主机名。 None
log_view_hours LogView保持时间(小时)。 24
local_timezone 使用的时区。True表示本地时间,False表示UTC,也可用pytz的时区。 1
lifecycle 所有表生命周期。 None
temp_lifecycle 临时表生命周期。 1
biz_id 用户ID。 None
verbose 是否打印日志。 False
verbose_log 日志接收器。 None
chunk_size 写入缓冲区大小。 1496
retry_times 请求重试次数。 4
pool_connections 缓存在连接池的连接数。 10
pool_maxsize 连接池最大容量。 10
connect_timeout 连接超时。 5
read_timeout 读取超时。 120
api_proxy API代理服务器。 None
data_proxy 数据代理服务器。 None
completion_size 对象补全列举条数限制。 10
notebook_repr_widget 使用交互式图表。 True
sql.settings ODPS SQL运行全局hints。 None
sql.use_odps2_extension 启用MaxCompute 2.0语言扩展。 False

数据上传下载配置

选项 说明 默认值
tunnel.endpoint Tunnel的Endpoint。 None
tunnel.use_instance_tunnel 使用Instance Tunnel获取执行结果。 True
tunnel.limit_instance_tunnel 是否限制Instance Tunnel获取结果的条数。 None
tunnel.string_as_binary 在STRING类型中使用Bytes而非 Unicode。 False

DataFrame配置

选项 说明 默认值
interactive 是否在交互式环境。 根据检测值。
df.analyze 是否启用非ODPS内置函数。 True
df.optimize 是否开启DataFrame全部优化。 True
df.optimizes.pp 是否开启DataFrame谓词下推优化。 True
df.optimizes.cp 是否开启DataFrame列剪裁优化。 True
df.optimizes.tunnel 是否开启DataFrame使用Tunnel优化执行。 True
df.quote ODPS SQL后端是否用``来标记字段和表名。 True
df.libraries DataFrame运行使用的第三方库(资源名)。 None
df.supersede_libraries 使用自行上传的Numpy替换服务中的版本。 False
df.odps.sort.limit DataFrame有排序操作时,默认添加的Limit条数。 10000

机器学习配置

选项 说明 默认值
ml.xflow_settings Xflow执行配置。 None
ml.xflow_project 默认Xflow工程名。 algo_public
ml.use_model_transfer 是否使用ModelTransfer获取模型 PMML。 False
ml.model_volume 在使用ModelTransfer时使用的 Volume名称。 pyodps_volume