随着AI的迅猛发展以及生产落地,实时数仓Hologres在AI相关能力上也持续演进,并提供了AI Function、向量检索等能力。该能力可帮助业务实现从数据挖掘、解析到智能推理与搜索的全流程闭环,从而释放数据的更大价值,促进业务进一步精细化增长。
AI资源与AI Function
Hologres自V3.2版本开始,提供AI资源(GPU)售卖、一键部署模型和AI Function的能力,您可以通过SQL方式使用AI Function。AI Function可自动路由到部署的模型,并且使用GPU资源执行整个过程。快速部署AI服务典型应用场景包括使用AI Function搭建企业知识库等,整个过程都通过SQL完成,不需要额外的代码,不需要部署额外的AI服务,不需要数据导出到别的系统,即可完成数据存储、检索、推理等完整的AI工作流。数据和模型通过Hologres一站式管理,开箱即可用。详情请参见AI资源与AI Function简介。
向量检索
Proxima是一款来自于阿里达摩院的实现向量近邻搜索的高性能软件库,相比于Faiss等开源的同类产品,Proxima在稳定性、性能等方面都更为出色。Hologres与Proxima深度融合,并结合Hologres AI资源与AI Function,可以高效应用于相似度搜索、图像检索以及场景识别等多种场景。详情使用见Proxima向量计算。
MCP
Hologres基于MCP协议实现了Hologres MCP Server,为AI Agent与Hologres数据库之间的提供了通用接口,实现了两者的无缝通信。该功能支持AI Agent获取Hologres数据库元数据并执行SQL操作,提升了AI与Hologres数据库的交互效率。
丰富的AI生态集成
在生态上,Hologres提供丰富的AI集成能力,包括:
与PAI深度集成:Hologres可以与PAI-EAS、PAI-LangStudio等核心能力对接、结合大模型以及Hologres高性能、低延时以及简单易用的向量计算能力,快速搭建企业知识库、ChatBI等应用场景。详情请参见使用Hologres+PAI+DeepSeek搭建企业专属问答知识库。
对接Dify:Dify是一款开源的大语言模型(LLM) 应用开发平台,融合了Backend as Service和LLMOps理念,助力开发者快速搭建生产级的生成式AI应用。目前Dify已支持Hologres的hologres_text2data插件,并在Dify官方市场推出,相关源码已经在GitHub开源。详情请参见基于Dify和Hologres快速搭建ChatBI应用。
Python SDK:Hologres兼容PostgreSQL 11,通过Psycopg访问Hologres,并实现高性能的数据读写。同时,Hologres也提供Python SDK向量版,可以通过该SDK实现高性能、低延时的向量计算。详情请参见向量计算SDK。