什么是图计算服务

图计算服务Graph Compute是阿里云自主研发的高性能分布式图计算产品,为开发者提供万亿级数据规模的一站式图技术服务。Graph Compute支持复杂图关系数据的存储、查询和计算,高效对接图算法与模型,在搜索推荐广告、实时风控、知识图谱、社交网络等场景有着广泛的应用。

前置概念

阅读本文前,您可能需要了解如下概念:

为什么选择图计算服务

复杂关系,简化表达

通过KKV可高效表达图模型中的关联关系,将常用的2度查询简化为1度查询,查询表达更简单。

源于开源,胜于开源

支持开源Gremlin语法,重点算子性能优化,让计算效率更高。

海量数据,灵活扩展

分布式集群架构可弹性运维,分钟级快速扩展服务和数据存储能力。

大数据生态,深度对接

对接完整的阿里云大数据及AI产品生态,提供基于MaxCompute+Flink+Graph Compute 的场景化图计算解决方案。

图计算服务Graph Compute特点

高性能

查询延时低、数据导入快(千亿数据查询延时2ms以内,数据载入最高达500w doc/s )。

低成本

通过提供倒排查询和向量计算的扩展能力,同需求场景下,引擎资源开销是采用其他方案的50%。

高可用

离线系统支持多版本备份,提供分钟级数据恢复功能,具有更强的容灾和数据回滚能力。

百万级TPS

Graph Compute采用异步更新架构,单节点支持百万级别TPS更新,保证数据的高时效性。

全托管

提供图形化展示的控制台,提升数据开发效率。数据链路全托管,业务运维0投入。

Graph Compute 与其他开源图计算相比的优势

问题一:查询性能为什么能比开源好很多

  • 图计算服务内核引擎iGraph在分区并发查询的基础上,通过自研的协程异步框架并发召回,将同步串行磁盘访问改造为异步并行,极大的提高了查询性能;同时将部分计算下沉,保证了复杂计算的性能。

  • 在基于磁盘的查询访问场景下引入了io_uring,支持高iops下稳定运行。

  • 内核引擎iGraph自研多级缓存,对热数据更加友好。

问题二:大数据导入能力对比开源有较大的提升?

  • Graph Compute拥有一套自研分布式索引构建服务,使得离线全量、增量、实时数据统一入口,离线全量、批次增量索引、配合在线实时增量索引解决在线索引LSM tree过度膨胀的问题。

  • 实时数据更新写入支持最终一致性,性能对比强一致性的写入对比开源有1~2个数据量级的性能优势。

问题三:Graph Compute的成本总体为什么能比开源低?

  • 架构的设计上我们优先考虑成本和高性能,保证资源的高利用率。

  • 较为完善的自动化运维系统让运维成本直线下降。

  • 天然支持多种类型索引(kv/kkv/倒排/向量),不需要申请额外的业务资源。

问题四:Graph Compute的稳定性为什么比开源高?

  • 针对异常和大促场景下iGraph内核引擎做了多年技术优化和沉淀来保证稳定性,同时配合高可用、自动负载均衡、自动扩缩容、自动降级等一系列自动化运维系统进行动态平衡流量和快速恢复。