快速创建Milvus实例

更新时间:
复制为 MD 格式

本文介绍如何快速创建向量检索服务Milvus版(简称Milvus)实例。

使用须知

向量检索服务Milvus版(简称Milvus)支持标准版和单机版:

  • 标准版:为企业级应用和大规模生产环境设计的分布式向量检索方案,采用多可用区集群部署,提供生产级高可用SLA,支持计算和存储资源的独立横向扩展,适用于需要高可靠性、高并发和大规模数据处理的生产场景。

  • 单机版:为个人开发者和小型团队设计的轻量级向量检索方案,采用单进程部署,不具备横向扩展能力,仅建议用于开发学习、功能验证或初期测试场景,不建议用于生产环境。

特性

单机版

标准版

核心定位

开发、测试、功能验证

生产环境、大规模应用

部署架构

单进程,单可用区部署

分布式集群,支持多可用区高可用

服务等级 (SLA)

单机版 SLA 低于标准集群,不提供生产级可用性保障

提供生产级高可用 SLA

扩展能力

不具备横向扩展能力,仅支持垂直升配

支持计算和存储资源的独立横向扩展

实例升级

无法直接升级为标准集群版,需通过数据迁移

支持在集群版内平滑升配

前提条件

  • 已拥有阿里云账号。如果您还没有阿里云账号,请先完成注册,详情请参见阿里云账号注册流程。

  • 首次购买时,需要您授予Milvus访问相应云资源的权限,详情请参见阿里云账号角色授权

  • 如果您使用RAM用户,需已完成RAM用户授权,详情请参见RAM用户授权

操作步骤

  1. 进入阿里云Milvus页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击实例列表

  2. 实例列表页面,单击创建实例,配置以下参数。

    配置项

    描述

    商品类型

    支持包年包月和按量付费类型。

    购买时长

    以包年包月方式购买时,默认购买时长为1个月,支持的购买时长以实际界面为准。

    地域

    实例所在的物理位置。

    重要

    实例创建后,无法更改地域,请谨慎选择。

    网络及可用区

    • 专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络。

      选择已有的专有网络,或者如需创建新的专有网络,可以单击前往控制台创建,详情请参见创建和管理专有网络

    • 交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。

      选择已有的交换机,或者如需创建新的交换机,可以单击控制台创建,详情请参见创建和管理交换机

    部署方案

    • 单可用区:适合开发测试环境,成本较低,部署简单,但不具备跨可用区容灾能力。

    • 多可用区基础版:计算资源仅有一份,因此宕机时需要一定的恢复时间,RTO1小时内,性价比更高。

    • 多可用区高可用版:两份计算资源,业务异常时可直接切换主备集群,RTO3分钟内。

    如需了解多可用区基础版与高可用版的具体差异、适用场景及架构特点,请参见多可用区基础版与高可用版对比

    版本

    支持2.4、2.5、2.6版本。

    实例系列

    • 标准版:为企业级应用和大规模生产环境设计的分布式向量检索方案,采用多可用区集群部署,提供生产级高可用SLA,支持计算和存储资源的独立横向扩展,适用于需要高可靠性、高并发和大规模数据处理的生产场景。

    • 单机版:为个人开发者和小型团队设计的轻量级向量检索方案,采用单进程部署,不具备横向扩展能力,仅建议用于开发学习、功能验证或初期测试场景,不建议用于生产环境。

    服务节点

    创建标准版实例时,需要配置该参数。

    主要负责处理客户端的请求和管理集群的状态。将查询请求分发到合适的计算节点,并收集结果返回给用户。同时,维护集群的元数据,以确保请求能够被正确路由至相应的计算节点。

    • Streaming Node:主要负责实时写入与增量数据消费。

      数据写入频繁、对“写入到可检索”的延迟要求较高时,强烈建议:增加节点数或提升规格,提升实时数据处理能力。

    • DataNode:主要负责数据写入、落盘和管理。

      数据写入量大、导入频繁时,强烈建议:增加节点数或提升规格,提高整体写入带宽与稳定性。

    • Proxy:主要负责接收客户端请求并进行路由。

      客户端连接数多、并发请求高时,强烈建议:增加节点数或提升规格,提升请求接入和转发能力。

    • 元数据服务:负责资源调度与任务协调。

      集群规模较大、数据分区多时,强烈建议:提升规格,以确保调度稳定。

    计算节点

    QueryNode:负责向量的检索与过滤。

    内存水位超过 70% 时,必须:增加节点数或提升规格,保证查询性能和稳定性。更多节点信息,请参见计算节点规格与性能对比

    数据副本数

    开启数据多副本能够很好地保证集群可用性,建议生产业务开启该功能。

    数据存储

    默认使用同城冗余存储,按实际存储的数据量计费,每小时根据您实际占用的存储空间(GB)收取费用。

    自动备份

    重要

    使用备份功能会产生存储费用,更多详情,请参见计费项

    自动备份功能默认开启。该功能旨在保障实例的数据安全,并保障服务SLA。如遇数据意外丢失,您可以通过该功能恢复数据。

    说明

    如果您需要关闭此功能,请在实例创建成功后,前往备份快照页签关闭,详情请参见备份与恢复

    登录密码

    设置Milvus实例的root(管理员)账号密码以登录数据库。

    说明

    如果您忘记了密码,可以参见常见问题

    OSS 数据加密

    OSS 数据加密需要调用 KMS 密钥管理服务,请前往 密钥管理服务控制台进行开通。

    资源组

    选择已有的资源组,或者如需创建新的专用资源组,可以单击创建资源组。资源组会对您拥有的云资源从用途、权限和归属等维度进行分组,详情请参见什么是资源组

    标签

    您可以在创建实例时绑定标签,也可以在实例创建完成后添加标签,这可以方便您识别和管理拥有的实例资源。有关标签的更多信息,请参见什么是标签

  3. 确认配置无误后,查阅并选中服务协议,单击创建实例

    当实例状态为运行中时,表示实例创建成功。

相关文档

  • Milvus现已无缝集成于阿里云PAI平台,一站式赋能用户构建高性能的检索增强生成(RAG)系统。您可以利用Milvus作为向量数据的实时存储与检索核心,高效结合PAILangChain技术栈,实现从理论到实践的快速转化,搭建起功能强大的RAG解决方案。解决方案详情,请参见通过阿里云MilvusPAI搭建高效的检索增强对话系统

  • Milvus作为一个高性能的向量检索服务,可以与阿里云PAI(EAS)以及Embedding技术相结合,构建一个基于大型语言模型(LLM)的智能问答系统。通过利用Milvus实现高效的向量检索能力,结合EAS上部署的LLM模型进行推理和文本理解,以及LangChain或其他知识管理工具链来组织和利用知识库,可以快速构建起强大的问答应用。解决方案详情,请参见通过阿里云MilvusLangChain快速构建LLM问答系统

  • Milvus和阿里云百炼提供的通义千问大模型能力,可以快速构建一个基于专属知识库的问答系统。解决方案详情,请参见通过阿里云Milvus和通义千问快速构建基于专属知识库的问答系统