图书智能标引助手

更新时间:
复制为 MD 格式

本实验将以“图书智能标引助手”为例,通过使用阿里云百炼搭建智能体了解利用AI辅助产品设计的方法,从而掌握阿里云百炼搭建智能体的技能和提示词的技巧。

实验简介

本实验将以“图书智能标引助手”为例,通过使用阿里云百炼搭建智能体了解利用AI辅助产品设计的方法,从而掌握阿里云百炼搭建智能体的技能和提示词的技巧。

背景知识

  • 阿里云百炼是一站式的大模型开发及应用构建平台。不论是开发者还是业务人员,都能深入参与大模型应用的设计和构建。您可以通过简单的界面操作,在5分钟内开发出一款大模型应用,或在几小时内训练出一个专属模型,从而将更多精力专注于应用创新。点击查看产品简介

  • 图书元数据是依据特定标准创建的图书结构化数据,通过基于图书CIP页面数据的自动标引,智能标引助手能够高效提取元数据,完成对图书特征的描述,有利于图书资源的归类、检索、管理。

实验室资源方式简介

进入实操前,请确保阿里云账号满足以下条件:

  • 个人账号资源

    • 使用您个人的云资源进行操作,资源归属于个人。

    • 平台仅提供手册参考,不会对资源做任何操作。

  • 确保已完成云工开物 300 元代金券领取。

  • 已通过实名认证且账户余额 ≥0 元。

  • 本实验费用以实际使用的token量为准,以Qwen-Plus为例,输入 0.0008元/千tokens,输出0.002元/千tokens;以Qwen- Max为例,输入0.02元/千tokens,输出0.06元/千tokens。

  • 本实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。

  • 实操结束后,无需对阿里云百炼进行注销。您可以选择继续付费保留资源,但这将导致持续产生费用,否则请根据实验手册释放资源。

  • 新注册阿里云百炼的用户,千问系列模型提供模型的免费额度,不同模型的免费额度不同,请在使用前,先阅读产品文档确认模型的免费额度,或在使用前,登录阿里云百炼-模型广场-模型卡片详情,查看具体模型的免费额度。注意在使用过程中的token消耗。模型列表 只有开通阿里云百炼服务后才能体验模型的免费额度。

资源消耗说明

本场景主要涉及以下云产品和服务:阿里云百炼大模型服务平台 Qwen-Plus-Latest模型

本实验,预计产生资源消耗:约0.004元(以使用模型输入含5CIP数据的用户prompt生成图书元数据,并输出可视化表格为例估算),如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。

  • 输入token:约1

  • 输出token:约1.5k

领取专属权益及创建实验资源

在开始实验之前,请先点击右侧屏幕的“进入实操”再进行后续操作

image

本次实验需要您通过领取阿里云云工开物学生专属300元抵扣券兑换本次实操的云资源,如未领取请先点击领取。(若已领取请跳过)

image

重要

实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。

学生认证

实验步骤

说明:本实验是一个比较简单的图书智能标引助手的智能体搭建实验,旨在帮助大家了解如何构建智能体完成图书元数据标引任务,您可以在本实验的基础上,对Prompt进行优化和调整,实现更多能力。

  1. 登录阿里云百炼

    • 在阿里云官网搜索阿里云百炼进入控制台,或点击进入阿里云百炼控制台,点击【应用】tab

      image

    • 进入【应用】—【应用管理】,点击【立即登录】

      image

    • 若之前未登录开通过阿里云百炼请按以下步骤操作,若已开通过百炼服务请跳过此步

      阅读服务协议并点击【同意】

      image

  2. 创建智能体

    • 点击【应用】——【应用管理】——【创建应用】

      image

    • 选择智能体应用,选择相应的类型,输入应用名称,点击【立即创建】

      image

  3. 配置智能体

    • 选择模型,模型选择:Qwen-plus ,可以在下拉列表中进行选择,若其中没有需要的模型,点击【更多模型】,在搜寻框输入搜索

      image.png

      image

    • 由于可能一次输入多条CIP数据进行识别,且可能输入多个用户prompt并进行调整,可以将最长回复长度设置为2000,并将上下文轮数设置为10

      image

      image.png

    说明

    模型参数配置介绍

    温度系数:控制生成随机性和多样性,数值越高多样性越强,数值越低一致性越强,范围(0,2)。建议该参数和top_p只设置1个。

    最长回复长度:模型生成的长度限制,不包含prompt。允许的最大长度因模型不同有所改变。

    携带上下文轮数:输入模型的最大历史对话轮数,轮数越多,对话相关性越强

  4. 构建提示词

    Prompt(提示词):是一个指令、问题或者语句,能被用来引导或指示一个语言模型生成特定的文本输出。Prompt是用户与语言模型交互的起始点,它告诉模型用户的意图,并且期望模型能以有意义且相关的方式回应。通过精心设计的prompt,我们可以引导大语言模型(LLM)更好地理解用户的意图,并生成更准确、有用的回答。Prompt工程涉及开发、优化和测试迭代prompt,以帮助用户有效地与语言模型进行交互。


    实验要求:做一个可以智能根据图书CIP页面数据提取元数据的智能体,获取结构化的图书特征,清晰展示图书的题名、责任者、出版者、出版时间、ISBN、分类号、主题词等核心元数据项,便于图书资源管理。

    input:图书CIP页面数据

    output:标准化的图书元数据


    在提示词部分编写prompt(提示词)

    image.png

    示例如下:

    # 角色
    你是一位资深的中文图书编目员,拥有丰富的编目经验。你精通《中国文献编目规则》和MARC21格式,能够将图书CIP页面数据转换为标准化的元数据标引结果。
    
    ## 技能
    ### 技能1: 元数据提取
    - 从CIP数据中准确识别题名、责任者、出版者、出版时间、ISBN、分类号、主题词等核心元数据项。
    - 确保提取的数据完整且准确。
    
    ### 技能2: 格式规范化
    - 按照中文图书编目标准对提取结果进行规范化处理,包括责任者规范、题名规范等。
    - 确保所有元数据项符合《中国文献编目规则》和MARC21格式的要求。
    
    ### 技能3: 表格化输出
    - 以Markdown表格形式呈现标引结果,包含以下列:序号、题名、责任者、出版者、出版时间、ISBN、分类号、主题词、备注。
    
    ## 输出
    1. 标引结果表格
       - 包含以下列:序号、题名、责任者、出版者、出版时间、ISBN、分类号、主题词、备注
    
    ## 限制
    - 只针对图书CIP页面数据进行元数据标引。
    - 确保所有元数据项符合《中国文献编目规则》和MARC21格式的要求。
    - 在标引过程中,避免引入个人观点或偏见,确保标引结果客观准确。

    提示:

    建议首先编写prompt(提示词)的初始版本,随后可使用优化功能进一步完善该提示词。点击优化——立即使用,若对生成结果不满意,选择重新生成

    image.png

    说明

    其他拓展功能说明

    阿里云百炼智能体应用有一些拓展智能体能力的方法,可选择性开启

    预解析文件:允许用户上传多模态文件,使用预置算法解析文件,支持用户对文件内容进行问答

    image.png

    知识库:提升私域知识问答能力

    联网搜索:依据场景触发联网搜索,搜索结果会拼接入提示词中(开启该功能将依据模型计费)

    image.png

    样例库:通过录入用户输入和期望的模型回复作为样例信息源,在模型调用时根据用户输入,检索召回相关样例信息,以此作为输出参考,从而提高大模型的回答准确性,适用于客服及问答等场景

    技能:调用工具增强模型能力

    MCP服务:模型通过标准化协议(MCP)连接企业内部服务API并发起调用;

    插件:调用外部 API,扩展智能体的能力和使用场景。

    智能体:调用已经配置好的智能体应用组件

    工作流:调用编排好的工作流应用组件

    记忆:设置上下文信息

    长期记忆:自动提取对话中的用户个性化信息存储到记忆片段中,用于后续对话推荐。

  5. 构建文档知识库优化智能体能力的示例

    • 点击【知识库】—【创建知识库】

      image

      • 选择适合的版本,点击创建知识库

        image

        重要

        注意:

        如后续不再使用阿里云百炼知识库,请在实验结束后删除!!如在实验结束后继续使用知识库,将按小时进行资源计费,费用参考:0.03 元/知识库/小时(标准版)和0.2 元/RCU/小时(旗舰版)

        image

      • 输入知识库名称,知识库类型及使用场景请按情况选择,此处保持默认选项即可,点击【下一步】

        image.png

      • 数据来源有多种选择方式,此处可以点击【上传文件】按钮,选择文件上传,点击【下一步】

        image.png

      • 按图进行配置,点击【完成】

        image.png

      • 系统自动进行文档解析。文档解析需要一定时间,请您耐心等待,直至状态变更为“解析完成”状态,才能在后续的文档问答过程中被检索到。

        image

        image

      • 在智能体中添加知识库

        image.png

      • 智能体可以根据知识库生成回答

        image.png

  6. 调用插件的操作示例

    • 在组件广场开通所需的插件

      image.png

    • 在智能体中添加相应插件

      image.png

    • 后续对话中模型可以根据情况调用插件生成内容

      image.png

  7. 测试智能体

    • 点击输入框模拟对话测试

      示例:

      1. 白鹿原 : 上中下 / 陈忠实著. -- 2版. -- 北京:人民文学出版社, 2025. -- (人文经典文库). -- ISBN 978-7-02-019411-7 Ⅰ. I247.5  中国国家版本馆CIP数据核字第20255HW636号
      2. 世上为什么要有图书馆 / 杨素秋著. -- 上海 : 上海译文出版社, 2024.1 (译文纪实) ISBN 978-7-5327-9413-3 Ⅰ. ①世… Ⅱ. ①杨… Ⅲ. ①纪实文学-中国-当代 Ⅳ. ①I25 中国国家版本馆CIP数据核字(2023)第185989号
      3. 信息资源管理 / 周晓英, 宛玲主编. -- 北京 : 首都经济贸易大学出版社, 2012.2  ISBN 978-7-5638-1988-1 Ⅰ. ①信… Ⅱ. ①周… ②宛… Ⅲ. ①信息管理-高等学校-教材 Ⅳ. ①G203 中国版本图书馆CIP数据核字(2011)第276507号
      4. 三体. 3 / 刘慈欣著. -- 重庆 : 重庆出版社, 2010.11  ISBN 978-7-229-03093-3 Ⅰ. ①三… Ⅱ. ①刘… Ⅲ. ①长篇小说-中国-当代 Ⅳ. ①I247.5 中国版本图书馆CIP数据核字(2010)第201591号
      5. 獾的礼物 / (英) 巴蕾 (Varley,S.) 著 ; 彭懿译上海 : 少年儿童出版社, 2006.05  (信谊世界精选图画书) ISBN 7-5324-6940-9Ⅰ. ①獾… Ⅱ. ①巴… ②彭… Ⅲ. ①图画故事-英国-现代 Ⅳ. ①I561.85 中国版本图书馆CIP数据核字(2006)第046359

      image.png

    • 检查运行结果是否符合预期,不符合预期的可以回到“模型配置”、“提示词编写”、“功能选择”这几个来进行调整,直至返回结果符合预期。

  8. 发布智能体

    • 当结果符合预期后,点击发布,就可以将写好的智能体分享给其他人使用。

      image.png

    • 可以根据需要选择不同的发布渠道

      image

      说明

      需注意,体验窗内为测试草稿版本,后续如需更新修改已发布版本,需在【版本管理】处切换到发布版

      image

      image

  9. 实验资源释放

    重要

    注意:

    1. 实验结束后,阿里云百炼账号无需注销,无资源释放。如已发布应用至其他渠道中,请关注token消耗量;

    2. 在阿里云百炼,模型训练部署等需要付费,请谨慎操作。模型体验、构建应用等需要消耗Token,在测试前请先确认是否有免费额度。

    • 删除智能体应用

      登录阿里云百炼控制台,进入应用管理页面。找到创建的智能体应用,点击应用名称进入详情页。在应用配置页面,找到删除应用的选项并确认删除。此操作将释放与该应用关联的模型配置、MCP服务集成以及知识库关联。

      image

    • 删除知识库

      如后续不再使用阿里云百炼知识库,请在实验结束后删除!!如在实验结束后继续使用知识库,将按小时进行资源计费,费用参考:0.03 元/知识库/小时(标准版)和0.2 元/RCU/小时(旗舰版)

      image

背景知识

本场景主要涉及产品:阿里云百炼

在本实验中,需要注意您当前账号中是否有免费额度,若无免费额度或免费额度已过期,本次实验会消耗token,可能产生费用。

模型token费用:请查看模型列表:模型列表

如何查看模型免费额度:登录阿里云百炼,在【模型】—【模型广场】—【全部模型】对应模型卡片查看详情,查看模型的免费额度,也可以关注系统管理-系统工具中的调用统计。

image

image

关闭实验

  • 完成实验后,点击 结束实操

    image

  • 点击 取消 回到实验页面,点击 确定 退出实验界面,关闭页面结束实验

    image

    说明

    阿里云百炼账号无需注销