快速创建Milvus实例
本文介绍如何快速创建向量检索服务Milvus版(简称Milvus)实例。
使用须知
向量检索服务Milvus版(简称Milvus)支持标准版和单机版:
标准版:为企业级应用和大规模生产环境设计的分布式向量检索方案,采用多可用区集群部署,提供生产级高可用SLA,支持计算和存储资源的独立横向扩展,适用于需要高可靠性、高并发和大规模数据处理的生产场景。
单机版:为个人开发者和小型团队设计的轻量级向量检索方案,采用单进程部署,不具备横向扩展能力,仅建议用于开发学习、功能验证或初期测试场景,不建议用于生产环境。
特性 | 单机版 | 标准版 |
核心定位 | 开发、测试、功能验证 | 生产环境、大规模应用 |
部署架构 | 单进程,单可用区部署 | 分布式集群,支持多可用区高可用 |
服务等级 (SLA) | 单机版 SLA 低于标准集群,不提供生产级可用性保障 | 提供生产级高可用 SLA |
扩展能力 | 不具备横向扩展能力,仅支持垂直升配 | 支持计算和存储资源的独立横向扩展 |
实例升级 | 无法直接升级为标准集群版,需通过数据迁移 | 支持在集群版内平滑升配 |
前提条件
操作步骤
进入阿里云Milvus页面。
登录阿里云Milvus控制台。
在左侧导航栏,单击实例列表。
在实例列表页面,单击创建实例,配置以下参数。
配置项
描述
商品类型
支持包年包月和按量付费类型。
购买时长
以包年包月方式购买时,默认购买时长为1个月,支持的购买时长以实际界面为准。
地域
实例所在的物理位置。
重要实例创建后,无法更改地域,请谨慎选择。
网络及可用区
部署方案
单可用区:适合开发测试环境,成本较低,部署简单,但不具备跨可用区容灾能力。
多可用区基础版:计算资源仅有一份,因此宕机时需要一定的恢复时间,RTO在1小时内,性价比更高。
多可用区高可用版:两份计算资源,业务异常时可直接切换主备集群,RTO在3分钟内。
如需了解多可用区基础版与高可用版的具体差异、适用场景及架构特点,请参见多可用区基础版与高可用版对比。
版本
支持2.4、2.5、2.6版本。
实例系列
标准版:为企业级应用和大规模生产环境设计的分布式向量检索方案,采用多可用区集群部署,提供生产级高可用SLA,支持计算和存储资源的独立横向扩展,适用于需要高可靠性、高并发和大规模数据处理的生产场景。
单机版:为个人开发者和小型团队设计的轻量级向量检索方案,采用单进程部署,不具备横向扩展能力,仅建议用于开发学习、功能验证或初期测试场景,不建议用于生产环境。
服务节点
创建标准版实例时,需要配置该参数。
主要负责处理客户端的请求和管理集群的状态。将查询请求分发到合适的计算节点,并收集结果返回给用户。同时,维护集群的元数据,以确保请求能够被正确路由至相应的计算节点。
Streaming Node:主要负责实时写入与增量数据消费。
数据写入频繁、对“写入到可检索”的延迟要求较高时,强烈建议:增加节点数或提升规格,提升实时数据处理能力。
DataNode:主要负责数据写入、落盘和管理。
数据写入量大、导入频繁时,强烈建议:增加节点数或提升规格,提高整体写入带宽与稳定性。
Proxy:主要负责接收客户端请求并进行路由。
客户端连接数多、并发请求高时,强烈建议:增加节点数或提升规格,提升请求接入和转发能力。
元数据服务:负责资源调度与任务协调。
集群规模较大、数据分区多时,强烈建议:提升规格,以确保调度稳定。
计算节点
QueryNode:负责向量的检索与过滤。
内存水位超过 70% 时,必须:增加节点数或提升规格,保证查询性能和稳定性。更多节点信息,请参见计算节点规格与性能对比。
数据副本数
开启数据多副本能够很好地保证集群可用性,建议生产业务开启该功能。
数据存储
默认使用同城冗余存储,按实际存储的数据量计费,每小时根据您实际占用的存储空间(GB)收取费用。
自动备份
重要使用备份功能会产生存储费用,更多详情,请参见计费项。
自动备份功能默认开启。该功能旨在保障实例的数据安全,并保障服务SLA。如遇数据意外丢失,您可以通过该功能恢复数据。
说明如果您需要关闭此功能,请在实例创建成功后,前往备份快照页签关闭,详情请参见备份与恢复。
登录密码
设置Milvus实例的root(管理员)账号密码以登录数据库。
说明如果您忘记了密码,可以参见常见问题。
OSS 数据加密
OSS 数据加密需要调用 KMS 密钥管理服务,请前往 密钥管理服务控制台进行开通。
资源组
选择已有的资源组,或者如需创建新的专用资源组,可以单击创建资源组。资源组会对您拥有的云资源从用途、权限和归属等维度进行分组,详情请参见什么是资源组。
标签
您可以在创建实例时绑定标签,也可以在实例创建完成后添加标签,这可以方便您识别和管理拥有的实例资源。有关标签的更多信息,请参见什么是标签。
确认配置无误后,查阅并选中服务协议,单击创建实例。
当实例状态为运行中时,表示实例创建成功。
相关文档
Milvus现已无缝集成于阿里云PAI平台,一站式赋能用户构建高性能的检索增强生成(RAG)系统。您可以利用Milvus作为向量数据的实时存储与检索核心,高效结合PAI和LangChain技术栈,实现从理论到实践的快速转化,搭建起功能强大的RAG解决方案。解决方案详情,请参见通过阿里云Milvus与PAI搭建高效的检索增强对话系统。
Milvus作为一个高性能的向量检索服务,可以与阿里云PAI(EAS)以及Embedding技术相结合,构建一个基于大型语言模型(LLM)的智能问答系统。通过利用Milvus实现高效的向量检索能力,结合EAS上部署的LLM模型进行推理和文本理解,以及LangChain或其他知识管理工具链来组织和利用知识库,可以快速构建起强大的问答应用。解决方案详情,请参见通过阿里云Milvus和LangChain快速构建LLM问答系统。
Milvus和阿里云百炼提供的通义千问大模型能力,可以快速构建一个基于专属知识库的问答系统。解决方案详情,请参见通过阿里云Milvus和通义千问快速构建基于专属知识库的问答系统。