全部产品
云市场
云游戏

与开源Spark功能对比

更新时间:2020-07-07 14:25:48

独享版Spark服务和开源Spark的功能对比如下表所示。

功能 开源Spark 独享版Spark服务
多数据源 页面一键关联阿里云Cassandra、HBase、MongoDB、RDS、Redis、PolarDB、Ganos等数据库实例。 X
支持Cassandra、HBase、HBase SQL(Phoenix)、MongoDB、Redis、RDS、LogHub、Kafka、MaxCompute等数据源的连接器。 X
通过一条SQL将Cassandra、HBase、HBase SQL(Phoenix)、MongoDB等数据同步归档到独享版Spark数仓的Parquet列存。 X
支持多数据源联邦分析。 X
数据工作台 资源管理支持通过页面管理Jar包等资源文件。 X
作业管理支持提交作业、提交SQL、实时更新状态、展示SparkUI、自定义参数及时间参数等。 X
工作流管理支持页面拖拽生成工作流构建作业依赖。 X
工作流管理支持工作流的周期调度。 X
报警支持作业、工作流运行失败的报警。 X
可靠性 服务组件高可用。 X
服务提供SLA保障。 X
集群节点和磁盘扩容不影响线上作业。 X
可维护性 自动部署、免去运维工作。 X
支持小版本升级。 X
集群状态、作业状态监控报警。 X
流处理作业支持延迟和吞吐的监控报警。 X
性能及成本 对多数据源的SQL连接器进行列裁剪、分区裁剪、谓词下推等优化。 X
独享版Spark的Storage支持云盘、D1机型,根据业务需求购买OSS。 X
计算资源支持弹性伸缩,实现资源成本最小化。 X
配置调优。 X
生态集成 支持通过command line管理Jar等资源文件。 X
提供Restful API管理作业。 X