Hologres+PAI一键部署企业级问答知识库部署文档

本文介绍如何一键部署企业级问答知识库服务实例。

背景信息

Hologres是阿里巴巴自研一站式实时数仓产品,不仅支持海量数据多维分析(OLAP)、高并发低延迟的在线数据服务(Serving),还与达摩院自研高性能向量计算软件库Proxima深度整合,支持高性能、低延时、简单易用的向量计算能力。更多信息,请参见Proxima向量计算

PAI-EAS是阿里云的模型在线服务平台,支持用户将模型一键部署为在线推理服务或AI-Web应用,可以一键部署LLM推理、AIGC等热门服务应用。PAI-EAS 适用于实时推理、近实时异步推理等多种AI推理场景,具备Serverless自动扩缩容和完整运维监控体系能力。 LangChain是一个开源框架,可以将大模型、向量数据库、定制语料结合,高效完成专属问答知识库的搭建。Hologres现已被LangChain作为向量数据库集成,详情请参见LangChain-Hologres

计算巢服务是一个开放给服务商和用户的服务管理PaaS平台,为服务商和用户提供了高效、便捷、安全的服务使用体验,服务商能更好地在阿里云上部署、交付和管理服务,用户能集中管理在阿里云上订阅的各类服务商提供的服务。通过计算巢,可以一键完成问答知识库所需的硬件资源拉起与软件资源部署。

前提条件

如果您使用RAM用户进行知识库搭建,需要通过主账号授予相应资源权限,需要的权限及授权方式请参见为用户侧RAM用户(子账号)授权

创建服务实例

  1. 单击部署链接

  2. 创建服务实例页,配置以下字段。

    模块

    参数

    说明

    服务实例名称

    test

    计算巢服务实例名称。

    地域

    华东1(杭州)

    Hologres、PAI-EAS、ECS实例所在地域。

    付费类型配置

    付费类型

    ECS和Hologres的计费方式,支持按量付费或包年包月PAI-EAS实例只支持按量付费。

    ECS实例配置

    实例类型

    ECS实例规格。

    实例密码

    ECS实例登录密码。

    Hologres实例配置

    实例规格

    Hologres计算资源规格Hologres存储资源默认为按量付费,推荐您根据业务数据量,购买合适的存储抵扣包

    PAI-EAS模型配置

    选择大模型

    您希望部署的LLM大模型。

    PAI实例规格

    PAI-EAS实例规格。

    VPC配置

    交换机可用区

    交换机所在可用区。

    是否新建VPC

    是否新建VPC。

    专有网络

    专有网络VPC实例ID或专有网络IPv4网段。

    交换机

    交换机实例ID或交换机子网网段。

    标签和资源组

    标签

    服务实例需要绑定的标签。

    资源组

    服务实例所属的资源组。

  3. 点击下一步:确认订单

  4. 查看订单页,确保依赖检查内容全部正常,单击立即创建

    创建“Hologres+PAI一键部署企业级问答知识库”服务实例需要耗时5-10分钟,您可以在服务实例页面中查看实例情况。

知识库使用

  1. 进入计算巢服务实例管理页,点击已部署的服务实例ID,进入服务实例详情页。

  2. 单击实例信息Endpoint后的链接,进入Hologres+大模型WebUI38.png

  3. 在WebUI的设置页配置以下信息。

    1. Embedding模型:默认选择text2vec-base-chinese模型。

    2. PAI-EAS连接信息:已默认填写计算巢部署的PAI-EAS模型的VPC连接信息。

    3. Hologres连接信息:

      1. 已默认填写计算巢部署的Hologres实例的VPC Host、Port、Database(chatbot)。

      2. 需要您在User和Password中填入您的阿里云AccessKey ID和AccessKey Secret,可以在阿里云官网Access Key管理查看。您也可以在Hologres中创建其他账号用于知识库搭建,详情请参见Hologres权限模型概述40.png

      3. 单击连接Hologres,收到“连接 Hologres 成功”提示,即说明连接成功。41.png

  4. 在WebUI的上传页。

    1. 上传您的专属语料数据。后台会对您的语料数据进行向量化处理并导入Hologres。42.png

    2. 收到“成功上传 x 个文件”提示,即说明数据处理完成。43.png

    3. 您可以在Hologres实例chatbot数据库下的langchain_demo表中查询您的语料数据。

  5. 在WebUI的聊天页。

    1. 选择聊天模式。

      1. 向量数据库:对您的提问,仅使用Hologres进行向量近似查询,返回top K结果。

      2. 大语言模型:对您的提问,仅使用大模型直接进行回答。

      3. 向量数据库+大语言模型:对您的提问,使用您已在Hologres中存储的语料数据进行向量近似查询,将结果对大模型进行提示词微调,最终使用大模型推理求解进行回答。44.png

    2. 选择最相关的k条语料:默认为3条。

    3. 选择prompt模板:建议选择通用模板,您也可以自定义prompt模板。

    4. 在提问框中输入您的问题,点击提交进行问答。45.png

至此,您已完成企业级问答知识库的调试。 您可以进一步使用PAI-EAS部署的大模型的调用信息(在PAI控制台-EAS实例详情页中查看),将知识库接入实际业务场景进行使用。如接入钉钉聊天群(参见使用Hologres和大模型免费定制专属聊天机器人)等。