本文为您介绍PyODPS的常见问题。

PyODPS节点是否支持Python 3?

支持。详情请参见创建PyODPS 3节点

使用PyODPS统计表中某个字段的空值率时,用EXECUTE_SQL还是DataFrame,哪个性能更高?

DataFrame聚合性能更高,推荐您使用DataFrame执行聚合操作,详情请参见聚合操作

如何使用PyODPS下载全量数据?

PyODPS默认不限制从Instance读取的数据量。但是对于受保护的项目,您通过Tunnel下载数据将受限。此时,如果未设options.tunnel.limit_instance_tunnel,系统会自动打开数据量限制,可下载的数据量受项目限制,通常为10000条。如果您需要手动限制下载的数据量,可以通过open_reader方法增加LIMIT选项,或设置options.tunnel.limit_instance_tunnel=True

通过PyODPS的DataFrame处理数据时,资源是如何使用的?

只有MaxCompute的对象才会调用MaxCompute资源。通过PyODPS的DataFrame处理数据时,使用MaxCompute的分布式计算能力,系统会将数据提交至MaxCompute集群,调用MaxCompute资源进行计算。执行df操作会使用到内存,例如下载数据。