快速创建Milvus实例

更新时间:2025-02-27 01:35:28

通过创建阿里云向量检索Milvus实例,能够迅速搭建起具备高性能、弹性伸缩特性的AI向量检索数据库,并借助内置可视化管理工具Attu实现高效运维与监控。本文为您介绍如何快速创建Milvus实例。

前提条件

  • 已拥有阿里云账号。如果您还没有阿里云账号,请先完成注册,详情请参见阿里云账号注册流程。

  • 首次购买时,需要您授予Milvus访问相应云资源的权限,详情请参见阿里云账号角色授权

  • 如果您使用RAM用户,需已完成RAM用户授权,详情请参见RAM用户授权

操作步骤

  1. 进入阿里云Milvus页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击Milvus实例

  2. Milvus实例页面,单击创建实例

  3. 在向量检索服务Milvus版页面,完成相关配置。

    配置项

    示例

    描述

    配置项

    示例

    描述

    付费类型

    包年包月

    仅支持包年包月类型。

    付费时长

    1个月

    默认购买时长为1个月,支持的购买时长以实际界面为准。

    地域和可用区

    华东1(杭州)

    可用区J

    实例所在的物理位置和可用区。

    重要

    实例创建后,无法更改地域和可用区,请谨慎选择。

    专有网络

    vpc_Hangzhou/vpc-bp1f4epmkvncimpgs****

    专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络。

    选择已有的专有网络,或者如需创建新的专有网络,可以单击前往控制台创建,详情请参见创建和管理专有网络

    交换机

    vsw_i/vsw-bp1e2f5fhaplp0g6p****

    交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。

    选择已有的交换机,或者如需创建新的交换机,可以单击控制台创建,详情请参见创建和管理交换机

    服务关联角色

    AliyunServiceRoleForCloudMilvus

    已授予您的阿里云账号的AliyunServiceRoleForCloudMilvus角色,以及与其关联的AliyunServiceRolePolicyForMilvus策略。

    Milvus使用此角色来访问您在其他云产品中的资源。

    引擎版本

    2.4

    Milvus的社区版本号。

    规格

    标准版

    Milvus实例的规格。

    • 入门版:适用于测试环境,且资源规格固定。

    • 标准版:适用于生产环境,资源规格可以按需定制。

      当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时,您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。

    高可用

    启用

    标准版默认开启高可用,入门版则不支持。您可以在创建实例时开启高可用,也可以在实例创建后开启。一旦启用了高可用模式,各组件的副本数量必须大于1。

    说明

    在生产环境中,强烈建议启用高可用,以便提供SLA支持,从而保障系统的持续稳定运行。

    服务节点

    • 元数据服务:4 vCPU 16 GiB 2

    • Proxy:2 vCPU 8 GiB 2

    • Index Node:4 vCPU 16 GiB 2

    • Data Node:2 vCPU 8 GiB 2

    主要负责处理客户端的请求和管理集群的状态。将查询请求分发到合适的计算节点,并收集结果返回给用户。同时,维护集群的元数据,以确保请求能够被正确路由至相应的计算节点。根据Milvus实例的规格配置以下信息:

    • 入门版:选择该规格时,还需配置Standalone规格参数,该参数是入门版节点配置,可以使用默认的4 vCPU 16 GiB。

    • 标准版:选择该规格时,还需要配置以下参数。

      • 元数据服务:用于存储实例状态信息的服务组件。IndexCoord、QueryCoordDataCoord服务混合部署在该节点上。

      • Proxy:指定Proxy节点的规格和副本数量。

      • Index Node:指定IndexNode节点的规格和副本数量。

      • Data Node:指定DataNode节点的规格和副本数量。

    计算节点

    Query Node 性能型 4 vCPU 16 GiB 2

    负责存储向量数据,并根据服务节点分配的任务执行具体的搜索、插入、删除等操作。更多计算节点信息,请参见计算节点规格与性能对比

    存储费用

    不涉及

    您无需预先选择存储容量,存储成本将根据实际的小时使用量进行计费(公测期间免费),使用量将直接显示在实例详情页面。

    自动备份

    默认开启

    重要

    使用备份功能会产生存储费用,更多详情,请参见计费项

    自动备份功能默认开启。该功能旨在保障实例的数据安全,并保障服务SLA。如遇数据意外丢失,您可以通过该功能恢复数据。

    说明

    如果您需要关闭此功能,请在实例创建成功后,前往备份快照页签关闭,详情请参见备份与恢复

    资源组

    请您自定义

    选择已有的资源组,或者如需创建新的专用资源组,可以单击创建资源组。资源组会对您拥有的云资源从用途、权限和归属等维度进行分组,详情请参见什么是资源组

    用户密码

    请您自定义

    设置Milvus实例的root账号密码以登录数据库。

    说明

    如果您忘记了密码,可以参见常见问题

  4. 单击立即购买并完成支付。

    当实例状态为运行中时,表示实例创建成功。

相关文档

  • 阿里云Milvus现已无缝集成于阿里云PAI平台,一站式赋能用户构建高性能的检索增强生成(RAG)系统。您可以利用Milvus作为向量数据的实时存储与检索核心,高效结合PAILangChain技术栈,实现从理论到实践的快速转化,搭建起功能强大的RAG解决方案。解决方案详情,请参见通过阿里云MilvusPAI搭建高效的检索增强对话系统

  • 阿里云Milvus作为一个高性能的向量检索服务,可以与阿里云PAI(EAS)以及Embedding技术相结合,构建一个基于大型语言模型(LLM)的智能问答系统。通过利用Milvus实现高效的向量检索能力,结合EAS上部署的LLM模型进行推理和文本理解,以及LangChain或其他知识管理工具链来组织和利用知识库,可以快速构建起强大的问答应用。解决方案详情,请参见通过阿里云MilvusLangChain快速构建LLM问答系统

  • 阿里云向量检索Milvus和百炼提供的通义千问大模型能力,可以快速构建一个基于专属知识库的问答系统。解决方案详情,请参见通过阿里云Milvus和通义千问快速构建基于专属知识库的问答系统

  • 本页导读
  • 前提条件
  • 操作步骤
  • 相关文档