本文介绍了AI搜索开放平台的产品功能和对应的文档动态。
2025年
06月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 语音识别 | AI搜索开放平台支持通过API的方式调用语音识别服务,可将视频或音频中的语音内容快速转化为结构化文本,可用于会议记录、视频检索、在线客服等场景。 | 2025-06-26 | |
新增 | 视频截帧 | AI搜索开放平台支持通过API的方式调用视频截帧服务,可从视频中提取关键帧画面,并结合文字识别(OCR)、图像解析或多模态向量服务,实现对视频内容的深度解析与结构化处理。 | 2025-06-26 | |
更新 | 文本向量化新增ops-qwen3-embedding-0.6b | Qwen3系列多语言(100+)文本向量化服务,输入最大长度32k,输出向量维度可自定义32~1024维,参数量0.6B | 2025-06-26 | |
更新 | 排序服务新增ops-qwen3-reranker-0.6b | Qwen3系列文档重排服务,支持100+语言,最大输入token长度32k(Query+doc长度),参数量0.6B。 | 2025-06-26 | |
更新 | 多模态向量服务新增ops-gme-qwen2-vl-2b-instruct | 基于 Qwen2-VL 多模态大型语言模型(MLLMs) 训练的多模态向量服务,支持单一模态及多模态组合输入,能够高效处理文本、图像及组合类型的数据。 | 2025-06-26 | |
新增 | 多模态向量 | 多模态向量(multi-modal-embedding) 基于Qwen2-VL多模态大型语言模型(MLLMs)训练的多模态向量服务,支持单一模态及多模态组合输入,能够高效处理文本、图像及组合类型的数据。 | 2025-06-4 |
04月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
更新 | 大模型服务新增Qwen3-235B-A22B | 新一代Qwen系列大型语言模型,基于广泛的训练,Qwen3在推理、指令跟随、Agent能力和多语言支持方面取得了突破性进展,可支持100多种语言和方言,具备强大的多语言理解、推理和生成能力。 | 2025-04-29 |
03月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 联网搜索 | 上线联网搜索功能,支持独立调用联网搜索API或在LLM回答过程中使用联网搜索。 | 2025-03-20 | |
更新 | LLM模型新增QwQ深度思考模型 | 基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。 | 2025-03-20 | |
更新 | 模型部署 | 新增模型来源渠道:ModelScope 新增模型类型:多模态向量化模型、排序模型 | 2025-03-13 | |
新增 | 服务开发 | AI搜索开放平台集成PAI DSW功能,开发者可直接在平台内通过Notebook完成服务开发与执行。 | 2025-03-13 |
02月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | DeepSeek模型 | AI搜索开放平台支持DeepSeek全系模型(含R1/V3及7B/14B蒸馏版本),提供OpenAI API兼容调用能力。 | 2025-02-14 |
01月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 模型部署 | AI搜索开放平台中的模型独立部署,提供更高并发、更低延迟的推理服务。 | 2025-01-07 |
2024年
10月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 向量降维服务 | 支持结合用户提供的向量数据,定制训练向量降维模型。 | 2024-10-23 |
09月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 增加rerank模型 | 增加自研rerank模型,融合多行业数据集训练,支持多语言,在中文C-MTEB的8个检索任务测评,超越开源bge-rerank系列模型。 | 2024-09-12 | |
新增 | 查询分析服务增加NL2SQL | 查询分析服务增加NL2SQL能力,支持NL2SQL服务配置及调用。 | 2024-09-12 | |
新增 | 增加多模态数据处理场景 | 场景中心新增多模态数据处理场景,支持文本、图片解析及向量化。 | 2024-09-12 | |
新增 | RAG场景增加Llamaindex代码架构 | 场景中心-基于RAG搭建知识库在线问答,增加Llamaindex代码架构。 | 2024-09-12 |
08月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
优化 | 图片解析OCR优化 | 图片解析OCR服务优化,性能提升40%左右。 | 2024-08 |
07月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 评测管理 | 通过效果评测模块对RAG链路进行效果测评,上传测评数据集后,可基于大模型输出测评结果。 | 2024-07-08 | |
新增 | 体验中心上传数据 | 体验中心支持上传自有数据进行服务体验。 | 2024-07-08 | |
新增 | 兼容OpenAI SDK | AI搜索开放平台与OpenAI进行接口兼容,开发者可通过OpenAI SDK调用AI搜索开放平台提供的服务。 | 2024-07-08 | |
新增 | RAG场景增加Langchain代码架构 | 场景中心-基于RAG搭建知识库在线问答,增加Langchain代码架构。 | 2024-07-08 | |
新增 | 查询分析服务 | 提供Query内容分析服务,基于大语言模型及NLP能力,可对用户输入的查询内容进行预处理及相关识别,同时支持相似问题扩展,有效提升RAG场景中检索问答效果。 | 2024-07-08 | |
新增 | 图片解析服务 | 新增图片内容解析服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可使用OCR能力进行图片文字识别,解析后的文本可用于图片检索问答场景。 | 2024-07-08 | |
新增 | 查询分析服务体验 | 体验中心增加查询分析服务,可根据历史消息、Query给出意图及相似问题。 | 2024-07-30 | |
新增 | RAG场景增加图片解析能力 | RAG场景增加文档中的图片解析能力,同时补充查询分析服务,可根据改写后的Query进行后续问答。 | 2024-07-30 | |
新增 | 增加VPC访问区域 | 支持上海、杭州、深圳、北京、青岛、张家口区域使用VPC访问服务。 | 2024-07-30 |
06月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 基于RAG搭建知识库在线问答 | 针对知识库在线问答场景,AI搜索开放平台提供完整的RAG开发链路搭建方法,整体链路包含数据预处理、检索服务以及问答总结生成三大模块。 | 2024-06-18 |
05月
类别 | 功能名称 | 功能描述 | 发布时间 | 相关文档 |
新增 | 大模型服务 | 新增大模型服务,包含通义千问,以及微调后的RAG专属大模型。 | 2024-05-21 | |
新增 | 排序服务 | 新增排序服务,提供通用的文档打分能力,可根据query与文档内容的相关性,按分数由高到低对doc进行排序,并输出对应的打分结果。 | 2024-05-21 | |
新增 | 文本稀疏向量服务 | 新增文本稀疏向量服务,支持将文本数据转化为稀疏向量形式表达。 | 2024-05-21 | |
新增 | 文本向量服务 | 新增文本向量服务,支持将文本数据转化为稠密向量形式表达。 | 2024-05-21 | |
新增 | 文档切片服务 | 新增文档切片服务,提供通用的文本切片策略,可基于文档段落格式、文本语义、指定规则,对HTML、Markdown、txt格式的结构化数据进行拆分,同时支持富文本形式提取code、image、table。 | 2024-05-21 | |
新增 | 文档解析服务 | 新增文档解析服务,支持从非结构化文档中提取出标题、分段等逻辑层级结构,以及文本、表格、图片等信息,并以结构化的格式输出。 | 2024-05-21 | |
新增 | 服务体验 | 新增控制台服务体验能力,支持文本解析、切片、向量、排序、大模型等服务体验。 | 2024-05-21 |