本文为您介绍PyODPS提供的配置选项。
您可以通过
odps.options
获得PyODPS提供的配置选项。
from odps import options
# 设置所有输出表的生命周期(lifecycle选项)。
options.lifecycle = 30
# 使用Tunnel下载string类型时使用bytes(tunnel.string_as_binary选项)。
options.tunnel.string_as_binary = True
# 用ODPS执行PyODPS DataFrame时,可以参照下面dataframe相关配置,在sort时将limit设置为一个比较大的值。
options.df.odps.sort.limit = 100000000
通用配置
选项 |
说明 |
默认值 |
end_point |
ODPS Endpoint。 |
None |
default_project |
默认Project。 |
None |
log_view_host |
LogView主机名。 |
None |
log_view_hours |
LogView保持时间(小时)。 |
24 |
local_timezone |
使用的时区。True表示本地时间,False表示UTC,也可用pytz 的时区。
|
None |
lifecycle |
所有表生命周期。 |
None |
temp_lifecycle |
临时表生命周期。 |
1 |
biz_id |
用户ID。 |
None |
verbose |
是否打印日志。 |
False |
verbose_log |
日志接收器。 |
None |
chunk_size |
写入缓冲区大小。 |
1496 |
retry_times |
请求重试次数。 |
4 |
pool_connections |
缓存在连接池的连接数。 |
10 |
pool_maxsize |
连接池最大容量。 |
10 |
connect_timeout |
连接超时。 |
5 |
read_timeout |
读取超时。 |
120 |
api_proxy |
API代理服务器。 |
None |
data_proxy |
数据代理服务器。 |
None |
completion_size |
对象补全列举条数限制。 |
10 |
notebook_repr_widget |
使用交互式图表。 |
True |
sql.settings |
ODPS SQL运行全局hints。 |
None |
sql.use_odps2_extension |
启用MaxCompute 2.0语言扩展。 |
False |
数据上传下载配置
选项 |
说明 |
默认值 |
tunnel.endpoint |
Tunnel的Endpoint。 |
None |
tunnel.use_instance_tunnel |
使用Instance Tunnel获取执行结果。 |
True |
tunnel.limit_instance_tunnel |
是否限制Instance Tunnel获取结果的条数。 |
None |
tunnel.string_as_binary |
在STRING类型中使用Bytes而非Unicode。 |
False |
DataFrame配置
选项 |
说明 |
默认值 |
interactive |
是否在交互式环境。 |
根据检测值。 |
df.analyze |
是否启用非ODPS内置函数。 |
True |
df.optimize |
是否开启DataFrame全部优化。 |
True |
df.optimizes.pp |
是否开启DataFrame谓词下推优化。 |
True |
df.optimizes.cp |
是否开启DataFrame列剪裁优化。 |
True |
df.optimizes.tunnel |
是否开启DataFrame使用Tunnel优化执行。 |
True |
df.quote |
ODPS SQL后端是否用`` 来标记字段和表名。
|
True |
df.libraries |
DataFrame运行使用的第三方库(资源名)。 |
None |
df.supersede_libraries |
使用自行上传的Numpy替换服务中的版本。 |
False |
df.odps.sort.limit |
DataFrame有排序操作时,默认添加的Limit条数。 |
10000 |
机器学习配置
选项 |
说明 |
默认值 |
ml.xflow_settings |
Xflow执行配置。 |
None |
ml.xflow_project |
默认Xflow工程名。 |
algo_public |
ml.use_model_transfer |
是否使用ModelTransfer获取模型 PMML。 |
False |
ml.model_volume |
在使用ModelTransfer时使用的 Volume名称。 |
pyodps_volume |