图书智能标引助手
基于阿里云百炼平台开发 “批量文档处理智能体”。先创建大模型问答应用并配置变量与功能,再上传含财务类文档等的知识库,最后添加知识库并测试验证,确保功能、交互等达标后发布,以改善传统文档修改创建效率问题。
实验简介
基于阿里云百炼平台开发 “批量文档处理智能体”。先创建大模型问答应用并配置变量与功能,再上传含财务类文档等的知识库,最后添加知识库并测试验证,确保功能、交互等达标后发布,以改善传统文档修改创建效率问题。
背景知识
创建智能体应用:通过阿里云百炼创建一个智能体应用。
创建智能体: 我们将通过智能体开发创建批量文档处理智能体,并对其进行配置。
增加知识库:添加相关,让智能体准确回答问题。
实验室资源方式简介
进入实操前,请确保阿里云账号满足以下条件:
个人账号资源
使用您个人的云资源进行操作,资源归属于个人。
平台仅提供手册参考,不会对资源做任何操作。
确保已完成云工开物 300 元代金券领取。
已通过实名认证且账户余额 ≥0 元。
本实验费用以实际使用的token量为准,以Qwen-Plus为例,输入 0.0008元/千tokens,输出0.002元/千tokens;以Qwen- Max为例,输入0.02元/千tokens,输出0.06元/千tokens。
本实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。
实操结束后,无需对阿里云百炼进行注销。您可以选择继续付费保留资源,但这将导致持续产生费用,否则请根据实验手册释放资源。
新注册阿里云百炼的用户,千问系列模型提供模型的免费额度,不同模型的免费额度不同,请在使用前,先阅读产品文档确认模型的免费额度,或在使用前,登录阿里云百炼-模型广场-模型卡片详情,查看具体模型的免费额度。注意在使用过程中的token消耗。模型列表 只有开通阿里云百炼服务后才能体验模型的免费额度。
领取专属权益及创建实验资源
在开始实验之前,请先点击右侧屏幕的“进入实操”再进行后续操作

本次实验需要您通过领取阿里云云工开物学生专属300元抵扣券兑换本次实操的云资源,如未领取请先点击领取。(若已领取请跳过)

实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。

实验步骤
当前财务部门深陷于发票、合同等海量文档的人工处理困境,效率低下且差错风险高。为此,我们启动“批量文档处理智能体”项目,旨在利用AI技术实现财务文档的自动化、精准化处理,将员工从重复劳动中解放出来,赋能企业财务数智化转型,提升核心竞争力。
登录阿里云百炼
在阿里云官网搜索阿里云百炼进入控制台,或点击进入阿里云百炼控制台,点击【应用】tab

进入【应用】—【应用管理】,点击【立即登录】

若之前未登录开通过阿里云百炼请按以下步骤操作,若已开通过百炼服务请跳过此步
阅读服务协议并点击【同意】

创建智能体
点击【应用】——【应用管理】——【创建应用】

选择智能体应用,选择相应的类型,输入应用名称,点击【立即创建】

配置智能体
选择模型
阿里云百炼提供了多种选择,如官方推荐、图片视频识别推荐和代码类等。我们选择:Qwen-plus ,该模型实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-Plus,达到同规模业界SOTA水平
可以在下拉列表中进行选择,若其中没有需要的模型,点击【更多模型】,在搜寻框输入搜索


构建提示词
Prompt(提示词):是一个指令、问题或者语句,能被用来引导或指示一个语言模型生成特定的文本输出。Prompt是用户与语言模型交互的起始点,它告诉模型用户的意图,并且期望模型能以有意义且相关的方式回应。通过精心设计的prompt,我们可以引导大语言模型(LLM)更好地理解用户的意图,并生成更准确、有用的回答。Prompt工程涉及开发、优化和测试迭代prompt,以帮助用户有效地与语言模型进行交互。
批量文档处理智能体主要实现对于财务类文档的编辑与修订和基于模板的创作。所以我们需要输入一些提示词,可以通过设置“角色”、“技能”、“限制”以引导大模型更好的应对用户的询问。我们通过设计“角色”对智能体的应用范围来进行细致化对应。例如我们只需要他处理财务相关的文档,不需要处理科研类的文档,就可以写“擅长处理财务类的Word和Excel文档”、“只讨论与财务类文档处理相关的主题”。我们可以输入“/”引用变量,可以在右上角点击“自定义变量”进行变量编辑。同时,我们也可以使用“优化”来完善我们的提示词。
在提示词部分编写prompt(提示词)

在自定义变量配置界面,我们需要输入变量名、描述和默认值。该助手支持多种变量配置,提升对话智能化和个性化体验。用户可以设置如${question}变量,该变量用于存储用户提出的问题,方便智能体判断用户需求。系统自带的${documents}用于调用知识库内容生成专业回答。

预解析文件
滑动配置界面往下,在文件处理模块,选择全文引用,可以通过解析器获取文件内容,传给智能体用于回复,此功能开启后,智能体可能能够对动态文件进行解析处理,以便在交互等场景中使用文件内信息。
说明预解析文件:允许用户上传多模态文件,使用预置算法解析文件,支持用户对文件内容进行问答

构建文档知识库优化智能体能力的示例
点击【知识库】—【创建知识库】

选择适合的版本,点击创建知识库
重要注意:
如后续不再使用阿里云百炼知识库,请在实验结束后删除!!如在实验结束后继续使用知识库,将按小时进行资源计费,费用参考:0.03 元/知识库/小时(标准版)和0.2 元/RCU/小时(旗舰版)

填写知识库名称和描述,描述知识库的主要内容以及会用于哪一个智能体进行知识库调用。针对该智能体,可以将描述写为:该知识库为 “批量文档处理智能体” 核心支撑,内容包含常见的合同,可以在模板创作时帮助智能体调用专业模板,为用户提供合规、实用的合同初稿。知识库类型选择为文档搜索,使用场景选择基础文档问答,点击【下一步】

数据来源有多种选择方式,此处可以点击【上传文件】按钮,选择文件上传,点击【下一步】

进入到索引设置界面,各类配置保持默认,点击【完成】。后续大模型回答时可以检索参考知识库中的文档。

系统自动进行文档解析。文档解析需要一定时间,请您耐心等待,直至状态变更为“解析完成”状态,才能在后续的文档问答过程中被检索到。


在智能体中添加知识库

智能体可以根据知识库生成回答

调用插件
如果需要联网搜索,可以打开联网搜索开关,也可以在MCP服务中添加“联网搜索”。我们在MCP服务中添加了“文档转Markdown”和“HTML 转 Markdown”,这两个服务可以更好的帮助智能体解析用户提供的文件,也可以帮助智能体生成更好的结果。

测试智能体
在智能体发布前,需开展多方位测试验证工作。先核验各项核心功能的运行稳定性,确保无卡顿、报错等问题,再模拟真实场景测试交互效果,保证响应精准、逻辑连贯。
针对模板创作技能:生成一张工资表,设计部张三基本工资20000,奖金1000,旷工扣款200,餐饮补贴500,社保报销200。

检查运行结果是否符合预期,不符合预期的可以回到“模型配置”、“提示词编写”、“功能选择”这几个来进行调整,直至返回结果符合预期。
针对文档修改技能:
原文档中王伟的身份证号码0123,修改王伟的身份证号码为4567


当智能体给出问题的回答后,要确认是否符合预期,同时检查所配置技能的完整性与实用性,以及记忆模块的存储、调取准确性。
确认回答符合预期后,点击发布按钮。
发布智能体
当结果符合预期后,点击发布,就可以将写好的智能体分享给其他人使用。

可以根据需要选择不同的发布渠道
说明需注意,体验窗内为测试草稿版本,后续如需更新修改已发布版本,需在【版本管理】处切换到发布版


实验资源释放
重要注意:
销实验结束后,阿里云百炼账号无需注销,无资源释放。如已发布应用至其他渠道中,请关注token消耗量;
在阿里云百炼,模型训练部署等需要付费,请谨慎操作。模型体验、构建应用等需要消耗Token,在测试前请先确认是否有免费额度。
删除智能体应用
登录阿里云百炼控制台,进入应用管理页面。找到创建的智能体应用,点击应用名称进入详情页。在应用配置页面,找到删除应用的选项并确认删除。此操作将释放与该应用关联的模型配置、MCP服务集成以及知识库关联。

删除知识库
如后续不再使用阿里云百炼知识库,请在实验结束后删除!!如在实验结束后继续使用知识库,将按小时进行资源计费,费用参考:0.03 元/知识库/小时(标准版)和0.2 元/RCU/小时(旗舰版)

背景知识
本场景主要涉及产品:阿里云百炼。
在本实验中,需要注意您当前账号中是否有免费额度,若无免费额度或免费额度已过期,本次实验会消耗token,可能产生费用。
模型token费用:请查看模型列表:模型列表
如何查看模型免费额度:登录阿里云百炼,在【模型】—【模型广场】—【全部模型】对应模型卡片查看详情,查看模型的免费额度,也可以关注系统管理-系统工具中的调用统计。


关闭实验
完成实验后,点击 结束实操

点击 取消 回到实验页面,点击 确定 退出实验界面,关闭页面结束实验
说明阿里云百炼账号无需注销































