数据集概述
AgentLoop 数据集是面向 AI Agent 和智能应用的数据管理能力,用于统一承载业务数据、知识数据和可检索上下文。它把数据组织为可定义结构的数据集,支持按业务场景创建字段、写入记录、更新数据,并通过查询接口为 Agent 提供实时、准确的上下文信息。
AgentLoop 数据集概述
通过 AgentLoop 数据集,开发者可以把分散的数据沉淀为标准化的数据资产。数据集支持文本、数值、浮点数、JSON 等常见字段类型,也支持在文本或 JSON 字段上配置 embedding 能力,使数据不仅可以被精确过滤和结构化查询,也可以用于语义检索、相似度计算和智能召回。对于 AI 应用来说,它既是数据存储容器,也是连接业务数据与模型推理的检索层。
主要能力
统一的数据集管理:支持创建、查看、更新、删除数据集,并按 AgentSpace 组织资源,便于不同 Agent 或业务空间管理各自的数据。
灵活的数据结构定义:支持通过 Schema 定义字段类型、描述数据含义,并可对 JSON 内部字段进行结构化建模,适配文档、表单、事件、用户画像等多种数据形态。
面向 Agent 的查询能力:提供统一查询入口,支持数据写入、更新、删除和读取;查询结果包含字段、类型、行数据和执行元信息,方便上层 Agent 直接消费。
检索与语义增强:支持关键词检索、条件过滤、SearchExpr 表达式、SQL 查询,以及结合 embedding 的语义距离、相似度和 top-k 检索能力。
数据生命周期治理:数据集元信息和结构变更有清晰的管理方式,支持后续 Schema 演进,避免数据定义和实际查询能力脱节。
生产化服务能力:围绕鉴权、AgentSpace 校验、请求追踪、计量日志和错误码提供服务化封装,便于集成到真实 Agent 应用链路中。
基本概念
数据集(Dataset):一类业务数据或知识数据的逻辑容器。
Schema:数据集的结构定义,描述字段名称、类型以及检索相关配置。
字段(Field):数据集中的数据单。