本文介绍如何使用无影 AgentBay SDK 创建表单填写代理。该代理可以将 HTML 表单上传至 AgentBay并在浏览器中打开表单,根据自然语言指令自动填写数据。
功能特性
将 HTML 表单上传至 AgentBay 环境。
使用 AgentBay 的浏览器功能在浏览器中打开表单。
使用自然语言指令填写表单字段。
自动提交表单。
框架集成指南
本项目采用支持多种代理框架的结构。请参考特定的框架集成指南获取详细的设置和使用说明:
LangChain 集成指南:LangChain 框架的完整设置和使用说明。
项目源码参考form-filling-agent。
项目结构
本项目采用模块化结构,将核心功能与框架特定集成分离:
├── README.md # 文档
├── .env # 环境变量
├── common/ # 公共核心功能
│ ├── src/ # 与框架无关的代码
│ │ ├── form.html # 示例 HTML 表单
│ │ └── form_filler.py # 核心表单填写功能
│ └── README.md # 文档
├── langchain/ # LangChain 集成
│ ├── data/ # 输出数据目录(屏幕截图等)
│ ├── src/ # LangChain 特定代码
│ │ ├── form_filling_agent.py # LangChain 特定实现
│ │ └── form_filling_agent_example.py # LangChain 编排示例脚本
│ └── requirements.txt # Python 依赖项公共模块
common目录包含可在不同代理框架中使用的所有核心功能。包括:
Agent-Bay 会话管理。
文件上传操作。
浏览器初始化和控制。
表单填写操作。
资源清理。
框架集成模块
框架特定目录(如 langchain)包含集成代码,这些代码使用公共模块的核心功能,并将其封装在框架特定组件中。
自定义
可以修改 form.html文件以使用自己的表单,并更新示例脚本中的指令以匹配您表单中的字段。
该文章对您有帮助吗?