表单填写

本文介绍如何使用无影 AgentBay SDK 创建表单填写代理。该代理可以将 HTML 表单上传至 AgentBay并在浏览器中打开表单,根据自然语言指令自动填写数据。

功能特性

  • 将 HTML 表单上传至 AgentBay 环境。

  • 使用 AgentBay 的浏览器功能在浏览器中打开表单。

  • 使用自然语言指令填写表单字段。

  • 自动提交表单。

框架集成指南

本项目采用支持多种代理框架的结构。请参考特定的框架集成指南获取详细的设置和使用说明:

  • LangChain 集成指南:LangChain 框架的完整设置和使用说明。

项目源码参考form-filling-agent

项目结构

本项目采用模块化结构,将核心功能与框架特定集成分离:

├── README.md            # 文档
├── .env                 # 环境变量
├── common/              # 公共核心功能
│   ├── src/             # 与框架无关的代码
│   │   ├── form.html    # 示例 HTML 表单
│   │   └── form_filler.py # 核心表单填写功能
│   └── README.md        # 文档
├── langchain/           # LangChain 集成
│   ├── data/            # 输出数据目录(屏幕截图等)
│   ├── src/             # LangChain 特定代码
│   │   ├── form_filling_agent.py       # LangChain 特定实现
│   │   └── form_filling_agent_example.py # LangChain 编排示例脚本
│   └── requirements.txt # Python 依赖项

公共模块

common目录包含可在不同代理框架中使用的所有核心功能。包括:

  • Agent-Bay 会话管理。

  • 文件上传操作。

  • 浏览器初始化和控制。

  • 表单填写操作。

  • 资源清理。

框架集成模块

框架特定目录(如 langchain)包含集成代码,这些代码使用公共模块的核心功能,并将其封装在框架特定组件中。

自定义

可以修改 form.html文件以使用自己的表单,并更新示例脚本中的指令以匹配您表单中的字段。