本文为您介绍Mars近期版本的更新说明,基于此您可以了解Mars对应版本中的新增功能、增强功能等内容。 Mars近期版本的更新说明如下,详细信息请单击对应版本链接获取。 版本 变更类型 描述 v0.6.3 新功能 DataFrame: md.Index添加更多功能,详情请参见Add more functionalities for `md.Index`(#1864)。 支持{DataFrame,Series}.rename_axis,详情请参见Implements `{DataFrame,Series}.rename_axis`(#1870)。 增强功能 允许内部序列化使用JSON,详情请参见Allow internal serialization to use JSON(#1882)。 优化{md.read_csv()、md.read_parquet()}.head()的性能,详情请参见Optimize performance of {md.read_csv(), md.read_parquet()}.head()(#1883)。 优化df.sort_values().head()的性能,详情请参见Optimize performance of `df.sort_values().head()`(#1888)。 支持对使用groupby().agg()的数据源进行列裁剪,详情请参见Support column pruning for groupby().agg() on data sources(#1889)。 提升named_{dataframe, series, tensor},支持获取更多元数据,详情请参见Improve `named_{dataframe, series, tensor}` that it's able to get more meta(#1897)。 v0.6.2 新功能 DataFrame 支持df.groupby().head(),详情请参见Implements head() on groupby objects(#1851)。 Learn 支持mars.learn.preprocessing.{MinMaxScaler, minmax_scale},详情请参见Implements `mars.learn.preprocessing.{MinMaxScaler, minmax_scale}`(#1858)。 增强功能 优化Proxima的recall_by_id计算方式,详情请参见Improve proxima `recall_by_id` computation method(#1805)。 修复Tensor和DataFrame读写vineyard,详情请参见Revise to/from vineyard, of Tensor and DataFrame(#1806)。 为read_parquet添加类似read_csv的内存预估机制,详情请参见Add memory estimation for `read_parquet` as well as `read_csv`(#1815)。 支持在Lambda中使用复合Agg函数,详情请参见Support using compound agg function in lambda(#1819)。 为reset_index添加incremental_index字段,默认值为False,详情请参见Add `incremental_index` argument to `reset_index` which by default is False(#1842)。 DataFrame和Series的to_pandas方法内部使用批方式获取数据,详情请参见Support `to_pandas` in a batch way for DataFrame and Series(#1859)。 支持在Kubernetes中指定记忆量表,详情请参见Support specifying memory scale in kubernetes(#1861)。 v0.6.1 新功能 Tensor 当Tensor转稀疏时,支持缺失参数,以支持指定非0的缺失值,详情请参见Support `missing` argument for `tensor.tosparse()` and `fill_value` argument for `sparse_tensor.todense()`(#1802)。 DataFrame 添加Replace接口,详情请参见Implements {DataFrame,Series}.replace(#1765)。 添加Cartesian_chunk接口,可以对两个DataFrame执行笛卡尔积,并对每个Chunk应用一个函数。该接口是对Pandas API的扩展,详情请参见Add `{DataFrame, Series}.cartesian_chunk` support(#1777)。 聚合和分组聚合对字符串连接操作做了优化,详情请参见Integrate `str.cat` into reduction and groupby-aggregation(#1781)。 聚合函数支持了Level参数,详情请参见Implements reduction with `level` argument(#1784)。 v0.6.0 兼容性 聚合和分组聚合在该版本中已重写,老版本的Mars客户端连接到新版本使用这些功能可能会出错。 新功能 DataFrame: DataFrame初始化时支持num_partitions参数,详情请参见Support `num_partitions` argument for DataFrame initializers(#1733)。 添加对命名聚合的支持,详情请参见Add support for named aggregations(#1748)。 增强功能 groupby.agg()使用ReductionCompiler统一,详情请参见Unify groupby.agg() using ReductionCompiler(#1739)。 缺陷修复 修复md.read_csv:当names和usecols都指定时可能会报错,详情请参见Fix `md.read_csv` when names and usecols specified(#1738)。 支持字符串dtype以减少Tensor并平衡PSRS,详情请参见Support string dtype for tensor reductions(#1746)。 在DataFrame上修复XGBoost和LightGBM,详情请参见Fix xgboost and lightgbm on DataFrames(#1751)。 修复在分布式模式下重复执行相同代码的问题,详情请参见Fix repeated execution of same code in distributed mode(#1753)。 支持将DataFrame的某一列设置一个标量Tensor,详情请参见Support setting scalar which is a tensor for DataFrame(#1758)。
在文档使用中是否遇到以下问题
更多建议
匿名提交