快速创建Milvus实例-向量检索服务 Milvus 版(Milvus)-阿里云帮助中心

文档备案控制台

本文介绍如何快速创建向量检索服务Milvus版（简称Milvus）实例。

使用须知

向量检索服务Milvus版（简称Milvus）支持标准版和单机版：

标准版：为企业级应用和大规模生产环境设计的分布式向量检索方案，采用多可用区集群部署，提供生产级高可用SLA，支持计算和存储资源的独立横向扩展，适用于需要高可靠性、高并发和大规模数据处理的生产场景。
单机版：为个人开发者和小型团队设计的轻量级向量检索方案，采用单进程部署，不具备横向扩展能力，仅建议用于开发学习、功能验证或初期测试场景，不建议用于生产环境。

特性	单机版	标准版
核心定位	开发、测试、功能验证	生产环境、大规模应用
部署架构	单进程，单可用区部署	分布式集群，支持多可用区高可用
服务等级 (SLA)	单机版 SLA 低于标准集群，不提供生产级可用性保障	提供生产级高可用 SLA
扩展能力	不具备横向扩展能力，仅支持垂直升配	支持计算和存储资源的独立横向扩展
实例升级	无法直接升级为标准集群版，需通过数据迁移	支持在集群版内平滑升配

免费试用

Milvus提供免费试用，您可以前往免费试用页面领取试用实例。每个实人认证账号仅支持领取一次免费试用，已购买过或试用过Milvus的账号无法再次领取。

前提条件

已拥有阿里云账号。如果您还没有阿里云账号，请先完成注册，详情请参见阿里云账号注册流程。
首次购买时，需要您授予Milvus访问相应云资源的权限，详情请参见阿里云账号角色授权。
如果您使用RAM用户，需已完成RAM用户授权，详情请参见RAM用户授权。

操作步骤

进入阿里云Milvus页面。
1. 登录阿里云Milvus控制台。
2. 在左侧导航栏，单击实例列表。

在实例列表页面，单击创建实例，配置以下参数。

配置项	描述
商品类型	支持包年包月和按量付费类型。
购买时长	以包年包月方式购买时，默认购买时长为1个月，支持的购买时长以实际界面为准。
地域	实例所在的物理位置。重要实例创建后，无法更改地域，请谨慎选择。
网络及可用区	专有网络是您在阿里云自己定义的一个隔离网络环境，您可以完全掌控自己的专有网络。选择已有的专有网络，或者如需创建新的专有网络，可以单击前往控制台创建，详情请参见创建和管理专有网络。交换机（vSwitch）是组成专有网络VPC的基础网络模块，用来连接不同的云资源。选择已有的交换机，或者如需创建新的交换机，可以单击控制台创建，详情请参见创建和管理交换机。
部署方案	单可用区：适合开发测试环境，成本较低，部署简单，但不具备跨可用区容灾能力。多可用区基础版：计算资源仅有一份，因此宕机时需要一定的恢复时间，RTO在1小时内，性价比更高。多可用区高可用版：两份计算资源，业务异常时可直接切换主备集群，RTO在3分钟内。如需了解多可用区基础版与高可用版的具体差异、适用场景及架构特点，请参见多可用区基础版与高可用版对比。
版本	支持2.4、2.5、2.6版本。
实例系列	标准版：为企业级应用和大规模生产环境设计的分布式向量检索方案，采用多可用区集群部署，提供生产级高可用SLA，支持计算和存储资源的独立横向扩展，适用于需要高可靠性、高并发和大规模数据处理的生产场景。单机版：为个人开发者和小型团队设计的轻量级向量检索方案，采用单进程部署，不具备横向扩展能力，仅建议用于开发学习、功能验证或初期测试场景，不建议用于生产环境。
服务节点	创建标准版实例时，需要配置该参数。主要负责处理客户端的请求和管理集群的状态。将查询请求分发到合适的计算节点，并收集结果返回给用户。同时，维护集群的元数据，以确保请求能够被正确路由至相应的计算节点。 Streaming Node：主要负责实时写入与增量数据消费。数据写入频繁、对“写入到可检索”的延迟要求较高时，强烈建议：增加节点数或提升规格，提升实时数据处理能力。 DataNode：主要负责数据写入、落盘和管理。数据写入量大、导入频繁时，强烈建议：增加节点数或提升规格，提高整体写入带宽与稳定性。 Proxy：主要负责接收客户端请求并进行路由。客户端连接数多、并发请求高时，强烈建议：增加节点数或提升规格，提升请求接入和转发能力。元数据服务：负责资源调度与任务协调。集群规模较大、数据分区多时，强烈建议：提升规格，以确保调度稳定。
计算节点	QueryNode：负责向量的检索与过滤。内存水位超过 70% 时，必须：增加节点数或提升规格，保证查询性能和稳定性。更多节点信息，请参见计算节点规格与性能对比。
数据副本数	开启数据多副本能够很好地保证集群可用性，建议生产业务开启该功能。
数据存储	默认使用同城冗余存储，按实际存储的数据量计费，每小时根据您实际占用的存储空间（GB）收取费用。

自动备份	重要使用备份功能会产生存储费用，更多详情，请参见计费项。自动备份功能默认开启。该功能旨在保障实例的数据安全，并保障服务SLA。如遇数据意外丢失，您可以通过该功能恢复数据。说明如果您需要关闭此功能，请在实例创建成功后，前往备份快照页签关闭，详情请参见备份与恢复。
登录密码	设置Milvus实例的root（管理员）账号密码以登录数据库。说明如果您忘记了密码，可以参见常见问题。
OSS 数据加密	OSS 数据加密需要调用 KMS 密钥管理服务，请前往密钥管理服务控制台进行开通。
资源组	选择已有的资源组，或者如需创建新的专用资源组，可以单击创建资源组。资源组会对您拥有的云资源从用途、权限和归属等维度进行分组，详情请参见什么是资源组。
标签	您可以在创建实例时绑定标签，也可以在实例创建完成后添加标签，这可以方便您识别和管理拥有的实例资源。有关标签的更多信息，请参见什么是标签。

确认配置无误后，查阅并选中服务协议，单击创建实例。

当实例状态为运行中时，表示实例创建成功。

相关文档

Milvus现已无缝集成于阿里云PAI平台，一站式赋能用户构建高性能的检索增强生成（RAG）系统。您可以利用Milvus作为向量数据的实时存储与检索核心，高效结合PAI和LangChain技术栈，实现从理论到实践的快速转化，搭建起功能强大的RAG解决方案。解决方案详情，请参见通过阿里云Milvus与PAI搭建高效的检索增强对话系统。
Milvus作为一个高性能的向量检索服务，可以与阿里云PAI（EAS）以及Embedding技术相结合，构建一个基于大型语言模型（LLM）的智能问答系统。通过利用Milvus实现高效的向量检索能力，结合EAS上部署的LLM模型进行推理和文本理解，以及LangChain或其他知识管理工具链来组织和利用知识库，可以快速构建起强大的问答应用。解决方案详情，请参见通过阿里云Milvus和LangChain快速构建LLM问答系统。
Milvus和阿里云百炼提供的千问大模型能力，可以快速构建一个基于专属知识库的问答系统。解决方案详情，请参见通过阿里云Milvus和千问快速构建基于专属知识库的问答系统。

上一篇：快速入门下一篇：快速实现向量检索

该文章对您有帮助吗？