文件交互

更新时间:2025-01-23 05:48:57

在智能体应用中您可以上传本地文件(文档、图片、视频或音频),实现智能体应用与文件之间的交互。

如何使用

在智能体应用内,单击输入框左上方的上传文件按钮,可上传符合文件要求的本地文件,支持单独上传或多文件组合上传,以实现与应用的交互。image

上传文档

智能体应用内上传符合文件要求的文档后,支持以下两种交互方式。

以下示例文档为百炼系列手机产品介绍.docx

文件与应用的交互

  1. 单击输入框左上方的上传文件按钮,上传本地文档;

  2. 在输入框中输入:“请帮我总结一下这个文件的内容”;

  3. 大模型将阅读上传的文件总结内容,并进行如下回复。

    image

文件与知识库的交互

  1. 单击输入框左上方的上传文件按钮,上传本地文档;

  2. 打开知识库检索增强开关,配置已创建好的知识库

    RAG应用无知识库检索增强开关,直接配置已创建好的知识库
  3. 在输入框中输入:“帮我在知识库里查找是否有相似的文件内容”;

    image

  4. 大模型将同时检索指定的知识库和上传的文件,并进行如下回复。

    image

上传图片

智能体应用内上传符合文件要求的图片后,图片中的文字内容可与知识库进行交互。步骤如下:

  1. 单击输入框左上方的上传文件按钮,上传本地图片;

    此处示例图片为test.png
  2. 打开知识库检索增强开关,配置已创建好的知识库

    RAG应用无知识库检索增强开关,直接配置已创建好的知识库
  3. 在输入框中输入:“帮我在知识库里查找是否有相似的内容”;

  4. 大模型将会同时检索指定知识库和上传的图片文件内容,得到如下回复。

    image

上传视频

在智能体应用内上传符合文件要求的视频后,可与应用进行交互,步骤如下:

  1. 单击输入框左上方的上传文件按钮,上传本地视频;

    此处视频文件示例为test.mp4
  2. 在输入框中输入:“这个视频里面有什么?”;

  3. 获取大模型对视频文件内容的分析。

    image

上传音频

在智能体应用内上传符合文件要求的音频后,可与应用进行交互,步骤如下:

  1. 单击输入框左上方的上传文件按钮,上传本地音频;

    此处音频文件示例为test.wav
  2. 在输入框中输入:“这个音频内容是什么?”;

  3. 获取大模型对音频文件内容的解析。

    image

文件要求

支持上传的文件上限10个。支持上传本地的文档、图片、视频或音频,格式要求为:

文档(单文件不超过100MB):.doc,.docx,.wps,.ppt,.pptx,.xls,.xlsx,.md,.txt,.pdf;

图片(单文件不超过20MB):.png,.jpg,.jpeg,.bmp,.gif;

目前仅支持上传包含文字内容的本地图片。

视频(单文件不超过512MB):.mp4,.mkv,.avi,.mov,.wmv;

音频(单文件不超过512MB):.aac,.amr,.flac,.flv,.m4a,.mp3,.mpeg,.ogg,.opus,.wav,.webm,.wma;

API调用

您可通过DashScope SDKHTTP调用智能体应用,实现文件交互功能。具体用法请参阅文件交互

  • 本页导读 (1)
  • 如何使用
  • 上传文档
  • 上传图片
  • 上传视频
  • 上传音频
  • 文件要求
  • API调用

点击开启售前

在线咨询服务