Hologres AI概述

随着AI的迅猛发展以及生产落地,实时数仓HologresAI相关能力上也持续演进,并提供了AI Function、向量检索等能力。该能力可帮助业务实现从数据挖掘、解析到智能推理与搜索的全流程闭环,从而释放数据的更大价值,促进业务进一步精细化增长。

AI资源与AI Function

HologresV3.2版本开始,提供AI资源(GPU)售卖、一键部署模型和AI Function的能力,您可以通过SQL方式调用AI Function(ai_embedai_gen等)。AI Function可自动路由到部署的模型,并且使用GPU资源执行整个过程。快速部署AI服务典型应用场景包括使用AI Function搭建企业知识库等,整个过程都通过SQL完成,不需要额外的代码,不需要部署额外的AI服务,不需要数据导出到别的系统,即可完成数据存储、检索、推理等完整的AI工作流。数据和模型通过Hologres一站式管理,开箱即可用。详情请参见AI资源与AI Function简介

非结构化数据Object Table

HologresV4.0版本起推出Object Table功能,支持以表的形式访问数据湖OSS中的非结构化数据(如文本、图像、语音、视频等)。结合Hologres AI Function,可对非结构化数据自动Embedding、切片,并将处理结果存储于实例内部,支持向量检索、全文检索等检索及推理场景。该功能拓展了企业数据处理范围,从结构化和半结构化数据拓宽到非结构化数据,提升了数据探索范围,为业务提供更加精细化的数据价值。详情请参见非结构化数据(Object Table)

向量检索

HologresV4.0版本全面升级了向量检索能力,新增HGraph向量检索算法,支持内存和磁盘混合索引,能够处理千亿级超大规模向量数据的写入与召回,并在向量召回性能、向量召回准确率和索引构建性能方面均表现优异。结合Hologres AI资源与AI Function,提供了多模态数据的一站式加工、向量化、写入与分析,可高效应用于相似度搜索、图像检索和场景识别等多种场景。。

全文检索

Hologres V4.0版本集成高性能全文检索引擎Tantivy,通过BM25检索算法实现了高性能的全文检索能力,支持丰富的分词器,可针对多语言灵活创建全文倒排索引,以及丰富的检索模式(关键词匹配、短语检索、自然语言检索、术语检索),可基于业务目标灵活进行全文检索。可通过全文和向量混合检索,显著提升AI在文本检索场景(如RAG)的表现。

MCP

Hologres基于MCP协议实现了Hologres MCP Server,为AI AgentHologres数据库之间的提供了通用接口,实现了两者的无缝通信。该功能支持AI Agent获取Hologres数据库元数据并执行SQL操作,提升了AIHologres数据库的交互效率。Hologres支持多渠道部署MCP ServerChatBI Agent,详情请参见MCPChat BI

丰富的AI生态集成

在生态上,Hologres提供丰富的AI集成能力,包括:

  • PAI深度集成:Hologres可以与PAI-EAS、PAI-LangStudio等核心能力对接、结合大模型以及Hologres高性能、低延时以及简单易用的向量计算能力,快速搭建企业知识库、ChatBI等应用场景。详情请参见基于Hologres、PAIDeepSeek搭建企业专属问答知识库

  • 对接Dify:Dify是一款开源的大语言模型(LLM) 应用开发平台,融合了Backend as ServiceLLMOps理念,助力开发者快速搭建生产级的生成式AI应用。目前Dify已支持Hologreshologres_text2data插件,并在Dify官方市场推出,相关源码已经在GitHub开源。详情请参见基于DifyHologres快速搭建ChatBI应用

  • Python SDK:Hologres兼容PostgreSQL 11,通过Psycopg访问Hologres,并实现高性能的数据读写。同时,Hologres也提供Python SDK向量版,可以通过该SDK实现高性能、低延时的向量计算。详情请参见向量计算SDK