随着 AI 的迅猛发展以及生产落地,实时数仓 Hologres 在 AI 相关能力上持续演进,支持从数据挖掘、数据解析到数据智能推理与搜索的全流程闭环,涵盖非结构化、结构化、半结构化等多模数据,通过 AI 能力将 Data 发挥更大价值,赋能业务精细化增长。
AI模型与AI Function
Hologres 提供一系列主流 AI 大模型,模型来源包括百炼模型、Hologres AI 节点(GPU、内置模型),可通过管控台一键部署模型,并在 Hologres 中使用 AI Function,通过 SQL 调用 AI Function(ai_embed、ai_gen 等)。AI Function 可自动路由到已部署的模型,整个过程通过 SQL 完成,无需额外代码、无需部署额外 AI 服务、无需将数据导出到其他系统,即可完成数据存储、检索、推理等完整 AI 工作流。数据与模型通过 Hologres 一站式管理,开箱即用。详情请参见AI模型与AI Function。
非结构化数据Object Table
在 AI 场景下,非结构化数据(如文本、图像、语音、视频等)以更多元的形态承载行为轨迹与复杂语义。Hologres 自 V4.0 版本起支持 Object Table,可以表的形式访问数据湖 OSS 中的非结构化数据及其元信息,结合 AI Function 可对非结构化数据自动 embedding、切片,并以结构化形式存储于实例内部,支持向量检索、全文检索等检索与推理场景。企业可检索与分析的数据范围从结构化、半结构化拓宽到非结构化数据,提升数据探索范围,为业务提供更精细化的数据价值。详情请参见非结构化数据(Object Table)。
向量检索
Hologres V4.0 版本升级了向量检索能力,支持 HGraph 向量检索算法,可支持内存+磁盘混合索引,支持千亿级超大规模向量数据写入与召回,在向量召回性能、召回准确率、索引构建性能上均表现优异。Hologres 向量计算结合 AI 资源与 AI Function,支持一站式完成多模态数据加工、向量化、写入与分析,可高效应用于相似度搜索、图像检索、场景识别等多种场景。详情请参见向量计算介绍。
全文检索
Hologres V4.0 版本基于高性能全文检索引擎 Tantivy,通过 BM25 检索算法实现高性能全文检索能力,支持丰富分词器,可针对多语言灵活创建全文倒排索引,支持多种检索模式(关键词匹配、短语检索、自然语言检索、术语检索),可基于业务目标灵活进行全文检索。通过全文+向量混合检索,可显著提升 AI 在文本检索场景(如 RAG)的表现。
MCP
Hologres 基于 MCP 协议实现了Hologres MCP Server,作为 AI Agent 与 Hologres 数据库之间的通用接口,实现 AI Agent 与 Hologres 的无缝通信,支持 AI Agent 获取 Hologres 数据库元数据并执行 SQL 操作。Hologres 支持多渠道部署 MCP Server 与 ChatBI Agent,最佳实践详见MCP与Chat BI。
丰富的AI生态集成
在生态上,Hologres 提供丰富的 AI 集成能力,包括:
-
与 PAI 深度集成:Hologres 可与 PAI-EAS、PAI-LangStudio 等核心能力对接,结合大模型与 Hologres 高性能、低延时、简单易用的向量计算能力,快速搭建企业知识库、ChatBI 等应用场景。详情请参见基于Hologres、PAI和DeepSeek搭建企业专属问答知识库。
-
对接 Dify:Dify 是一款开源大语言模型(LLM)应用开发平台,融合 Backend as Service 与 LLMOps 理念,助力开发者快速搭建生产级生成式 AI 应用。目前 hologres_text2data 插件已上线Dify 官方市场,源码已在GitHub开源,可通过 Hologres + Dify 快速搭建企业级 ChatBI。详情请参见基于Dify和Hologres快速搭建ChatBI应用。
-
Python SDK:Hologres 兼容 PostgreSQL 11,可通过 Psycopg 访问 Hologres 并实现高性能数据读写;同时提供 Python SDK 向量版,可实现高性能、低延时的向量计算。详情请参见搜索(Search)SDK。