随着大模型智能体应用Agent的快速增长,搭建“信息查询能力”的大模型智能体应用是目前企业级Agent市场最广泛和成熟的应用场景。各企业在构建“企业级”智能体应用的过程中,面临缺乏流量入口的统一运营规划、内部知识库多源异构整合难、需要高时效准确的联网信息源来补充大模型知识不足和幻觉等各种问题的困扰。「信息查询服务IQS」产品的定位就是帮助上述企业客户,高效和高质量的搭建“信息查询类”企业级智能体应用。
前置概念
阅读本文前,您可能需要了解如下概念:
信息查询服务IQS - 背景与挑战
目前企业级智能体应用建设面临诸多挑战,具体如下表所示:
挑战一:大模型知识不足和幻觉问题
权威性:受限于模型训练知识限制,面对复杂、专业的问题,大模型幻觉可能输出错误的答案;
时效性:大模型对当下发生事项无法感知(如热点时间、最新趋势),影响回答的时效性;
全面性:大模型训练数据有限(全面高质知识获取难),难以覆盖所有领域及最新信息,影响模型回答质量。
挑战二:企业内部知识库整合难
重复造轮子:企业内小团队低成本的搭建自有的知识库,但随之而来会引发安全访问、知识权限等一系列问题;
异构RAG无法兼容:现有知识库的解决方案繁杂,知识库一旦构建后,异构系统之间很难兼容,否则会面临知识重新倒入的巨大成本;
知识检索准确度不足:很多知识库方案只是标准的向量检索方案,但面对复杂的企业问题很难给出准确度高的答案。
挑战三:数据工程能力偏弱
模型训练数据提取:如何从私有和联网的海量信息中,提取到高质量的训练数据,是决定垂直模型性能的关键因素;
知识库数据解析:非结构化的文件类型数据,需要更新和性能更强的文件解析、向量化和图谱化的技术能力。
挑战四:技术架构的选择困难
低代码方案定制性不足:大部分低代码搭建Agent的方案偏黑盒化,客户很难对具体的能力节点做定制和升级;
高代码框架有开发成本:高代码框架偏底层技术架构,客户需要自行开发各种能力来实现Agent,这就对企业的技术团队提出更高的要求。
挑战五:缺乏统一流量运营规划
Agent泛滥:每个企业动辄几百个智能体应用,无法做到用户想用的时候真正找到的;
缺少统一的用户心智和业务入口:企业内部各业务线和各职能部门之间的数据、运营和智能体无法统一协调,统一流量入口。
为了解决以上问题,阿里云推出了信息查询服务iQS平台,帮助客户在搭建大模型智能体应用过程中做到业务统一、技术架构统一和知识数据统一。
信息查询服务IQS - 核心优势
核心优势 | 说明 |
整合优质信息源 | 整合阿里内外部各有价值信息源,包括:联网搜索信息、周边位置信息和电商商品信息等。 |
多源异构RAG整合 | 整合各种异构RAG知识库,提供统一的权限控制、文件召回和检索后处理。 |
应用开发大幅提效 | 提供高代码开发套件,加速企业的智能体开发。包括:意图引擎、推理引擎等能力,内置技术最佳实践。降低了应用开发门槛,应用整体开发成本可降低80%。 |
数字资产沉淀与复用 | 提供数据统一处理能力,帮助企业客户完成大模型场景下必须的非结构化数据统一高质量处理的需求。帮助企业完成资产的持续沉淀和复用。 |
统一流量入口 | 提供低代码快速搭建企业统一信息查询Portal入口的“企业超级框”应用,包括:页面编排、智能体发布和管理等。 |
信息查询服务IQS - 产品功能
产品板块 | 功能 | 描述 |
Portal企业超级框 | 多源信息组装和管理 | 提供对接客户自有数据服务、检索引擎等多种来源的综合信息查询管理portal |
数据权限管理 | 支持根据组织架构、账号进行综合信息查询管理的权限管控,实现业务数据安全访问 | |
AccStack开发套件一: 意图引擎 | 意图检索与识别 | 提供多层意图结构(如父意图、子意图)的可视化管理工具,支持动态扩展意图层级,支持录入和管理意图触发样本。 |
AccStack开发套件二: 知识引擎 | 知识检索 | 支持对检索Query进行改写和增强 综合全文检索(关键词匹配)、向量检索(语义相似度)和图检索(实体关系),提供多维度知识检索能力。 支持从内外部多个异构知识源进行知识检索并合并检索结果。 对检索结果进行条件过滤、权限过滤、结果压缩及二次精排序。 |
数据工程 | 针对文档类信息进行解析,过滤重复、长度不足等数据内容 从全文或指定的文本片段中自动提取和生成高质量QA对,构建独立的问答索引,提升精准应答能力。 知识清洗、知识处理和知识增强的多种算子 | |
AccStack开发套件三: 推理引擎 | 深度推理规划 | 根据查询需求进行查询深度任务规划 |
自主行动和获得反馈 | 根据深度任务规划进行检索引擎、浏览器等外部信息查询和获得信息反馈 | |
行动评估和调整 | 根据获得的反馈进行多维度分析和评估、调整任务规划 | |
查询结果整合和交付 | 整合综合查询结果进行查询任务交付 | |
AccStack开发套件四: 自动化引擎 | 插件选择 | 为综合查询任务规划的执行选择最优的插件 |
插件参数解析 | 解析查询场景下插件最优的参数组合 | |
插件调用执行 | 使用最优的参数组合来进行插件调用执行 | |
AccStack开发套件五: 联网搜索引擎 | 向量化存储与语义检索 | 兼容多种向量引擎、支持相似度检索、语义扩展。 |
全量与增量索引构建管理 | 支持倒排/关键词索引、向量索引混合检索,提供索引生命周期管理 | |
分层信息缓存 | 结构化内容分级缓存,内容指纹检测更新,支持冷热数据分层 | |
网页内容读取与结构化解析 | 支持按 URL/站点解析;自动抽取正文,理解多模态信息并提供富文本输出 |
信息查询服务IQS - 适用场景
一站式企业级智能体应用入口:企业内需要搭建统一的Agent Store管理全部智能体应用;
基于统一智能体框架高效开发:避免重复造轮子,利用开源框架+能力复用的方案高效开发智能体应用;
统一的知识和数据管理体系:建设统一技术架构、统一安全访问控制和高性能的数据处理的企业知识库系统,支撑各类智能体需求;
搭建自有联网搜索:企业内需要搭建自主可控的外部网页读取体系用于补充企业内知识内容的不足;