数据集控制台接入
数据集控制台用于在 AgentLoop 中创建、管理和使用数据集。开发者可以在数据中心中集中维护来自 Trace、CSV 文件或手动定义的数据集,并在后续评估、调优、标注和实验流程中复用这些数据。数据集支持字段统一治理、版本可追溯和查询验证,适合构建评测样本集、业务知识样本、对话样本或自定义结构化数据。
创建数据集
登录AgentLoop 控制台,选择目标工作空间。
打开数据中心模块,在数据集页点击创建数据集。创建页面主要包含基础信息、数据来源和字段定义等配置区域。
基础信息:
数据集名称:建议使用小写字母、数字和下划线,便于后续查询和管理。
描述:用于说明数据集用途,例如「客服问答评测集」「Trace 清洗样本集」「模型对齐测试集」等。
数据来源:支持三种方式。
从 Trace 数据处理:适合已有 Agent 运行 Trace 的场景。系统可以从接入的 Trace 数据中提取字段并生成数据集,适合自动化构建评测样本。
上传 CSV / Excel / JSONL 文件:适合离线样本导入。上传本地文件后,系统会识别字段结构并辅助完成数据集创建。
从空白开始:适合完全自定义的数据集。用户可以手动定义字段名称、字段类型、向量索引和中文支持等配置。
字段定义:若选择从空白开始,需在字段定义中配置数据结构。
字段通常包括字段名称、字段类型、是否配置向量索引、是否支持中文等信息。常见场景中可以定义如
question、expected_output、context等字段,并为需要语义检索的文本字段配置向量索引。
管理数据集
登录AgentLoop 控制台,选择目标工作空间。
打开数据中心模块,在数据集页选择目标数据集名称进入详情页。
详情页以数据集名称为主入口,提供数据详情、字段管理和标注等功能区域。
数据详情:用于查看、查询和维护数据记录。页面支持新增记录、批量上传,也可以直接在查询框中执行查询语句,验证数据是否写入成功或检查数据分布。
字段管理:用于查看和维护当前数据集的字段结构,包括字段名称、类型、向量索引和中文支持配置。
标注:用于围绕数据集进行样本标注或后续评估流程管理。
在数据详情页中,控制台提供列表视图切换、悬浮预览开关、查询输入框和执行查询按钮。用户可以通过查询语句查看数据内容,例如统计当前数据集记录数量,或筛选指定字段下的样本。查询结果会以表格形式展示,便于快速确认数据状态。
数据写入与查看
数据集支持单条新增和批量上传两种常见写入方式。对于少量样本,可以点击新增记录手动录入;对于已有 CSV 或批量样本,可以使用批量上传快速导入。
当数据集为空时,详情页会提示当前暂无数据,并引导用户通过新增记录或批量上传添加数据。数据写入后,可通过查询入口进行验证,例如查看总数、按字段筛选、检查具体样本内容等。
数据处理接入
对于来自 Trace 的数据,控制台提供数据筛选和处理入口。用户可以按 Agent 应用筛选 Trace 数据,也可以展开高级筛选进一步限定数据范围。筛选后的数据可进入后续处理流程,用于抽取字段、清洗样本并生成可评估的数据集。
这种方式适合将 Agent 真实运行过程中的输入、输出、上下文和参考答案沉淀为评估数据,减少人工整理成本,让数据集可以持续服务于评测、实验和模型优化。
删除数据集
数据集详情页提供删除按钮。删除前需要确认操作。
删除数据集会移除该数据集及其中的数据内容,可能影响依赖该数据集的评估、实验或标注流程。删除前建议确认数据是否仍被使用。