一站式数据加工分析智能推理-Hologres AI-实时数仓 Hologres-阿里云

随着AI的迅猛发展以及生产落地，实时数仓Hologres在AI相关能力上也持续演进，并提供了AI Function、向量检索等能力。该能力可帮助业务实现从数据挖掘、解析到智能推理与搜索的全流程闭环，从而释放数据的更大价值，促进业务进一步精细化增长。

AI资源与AI Function

Hologres自V3.2版本开始，提供AI资源（GPU）售卖、一键部署模型和AI Function的能力，您可以通过SQL方式调用AI Function（ai_embed、ai_gen等）。AI Function可自动路由到部署的模型，并且使用GPU资源执行整个过程。快速部署AI服务典型应用场景包括使用AI Function搭建企业知识库等，整个过程都通过SQL完成，不需要额外的代码，不需要部署额外的AI服务，不需要数据导出到别的系统，即可完成数据存储、检索、推理等完整的AI工作流。数据和模型通过Hologres一站式管理，开箱即可用。详情请参见AI资源与AI Function简介。

非结构化数据Object Table

Hologres自V4.0版本起推出Object Table功能，支持以表的形式访问数据湖OSS中的非结构化数据（如文本、图像、语音、视频等）。结合Hologres AI Function，可对非结构化数据自动Embedding、切片，并将处理结果存储于实例内部，支持向量检索、全文检索等检索及推理场景。该功能拓展了企业数据处理范围，从结构化和半结构化数据拓宽到非结构化数据，提升了数据探索范围，为业务提供更加精细化的数据价值。详情请参见非结构化数据（Object Table）。

向量检索

Hologres自V4.0版本全面升级了向量检索能力，新增HGraph向量检索算法，支持内存和磁盘混合索引，能够处理千亿级超大规模向量数据的写入与召回，并在向量召回性能、向量召回准确率和索引构建性能方面均表现优异。结合Hologres AI资源与AI Function，提供了多模态数据的一站式加工、向量化、写入与分析，可高效应用于相似度搜索、图像检索和场景识别等多种场景。。

全文检索

Hologres V4.0版本集成高性能全文检索引擎Tantivy，通过BM25检索算法实现了高性能的全文检索能力，支持丰富的分词器，可针对多语言灵活创建全文倒排索引，以及丰富的检索模式（关键词匹配、短语检索、自然语言检索、术语检索），可基于业务目标灵活进行全文检索。可通过全文和向量混合检索，显著提升AI在文本检索场景（如RAG）的表现。

MCP

Hologres基于MCP协议实现了Hologres MCP Server，为AI Agent与Hologres数据库之间的提供了通用接口，实现了两者的无缝通信。该功能支持AI Agent获取Hologres数据库元数据并执行SQL操作，提升了AI与Hologres数据库的交互效率。Hologres支持多渠道部署MCP Server与ChatBI Agent，详情请参见MCP与Chat BI。

丰富的AI生态集成

在生态上，Hologres提供丰富的AI集成能力，包括：

与PAI深度集成：Hologres可以与PAI-EAS、PAI-LangStudio等核心能力对接、结合大模型以及Hologres高性能、低延时以及简单易用的向量计算能力，快速搭建企业知识库、ChatBI等应用场景。详情请参见基于Hologres、PAI和DeepSeek搭建企业专属问答知识库。
对接Dify：Dify是一款开源的大语言模型（LLM）应用开发平台，融合了Backend as Service和LLMOps理念，助力开发者快速搭建生产级的生成式AI应用。目前Dify已支持Hologres的hologres_text2data插件，并在Dify官方市场推出，相关源码已经在GitHub开源。详情请参见基于Dify和Hologres快速搭建ChatBI应用。
Python SDK：Hologres兼容PostgreSQL 11，通过Psycopg访问Hologres，并实现高性能的数据读写。同时，Hologres也提供Python SDK向量版，可以通过该SDK实现高性能、低延时的向量计算。详情请参见向量计算SDK。