文档

模型体验介绍

更新时间:

本篇内容介绍模型体验和模型调试。

模型体验

支持选择多个模型同时体验,快速对比不同模型的效果,最多同时选择3个模型,支持差异化模型配置及重复模型选择。

image

说明
  • 为了保障模型的正常使用和输出质量,模型体验中心不同模型的文本输入长度限制不同,例如Qwen-Long模型输入Token限制为2k个。如果您需要输入更长的文本,建议使用API调用方式,具体操作请参见API详情

  • 关于模型输入输出限制Token的具体规则,以及各大模型收费标准,请参见模型列表

  • 关于Token的计算方法,请参见Token是怎么计算的

示例内容

问法:阿里云百炼大模型是什么

下方图片展示选择的不同大模型回复的内容。

image

模型调试

支持调试模式,透明化查看模型输出结果,支持Prompt模式及Message模式,便于开发者调试模型效果。

说明

prompt模式更侧重于单次的文本生成,而message模式则适用于需要跟踪对话历史的多轮对话场景。

  • prompt模式:在prompt模式下,您直接向模型提供一段文本作为输入,这段文本即为prompt,模型根据prompt生成响应。prompt可以包含指令、问题、上下文等信息,指导模型生成特定格式或内容的回复。

  • message模式:message模式更适用于对话场景。它通过一系列的message(消息)来构建对话历史,每个message包括角色(如system、user、assistant)和内容。模型基于整个对话历史生成回复,能够保持对话的连贯性和上下文的一致性。

image

支持top-p、system、自定义随路参数及自定义停止符等多种自定义模型配置,支持多模型多配置差异化效果对比。

说明

system:系统人设,例如“你是一个AI助手”。

top_p:控制核采样方法的概率阈值,取值越大,生成的随机性越高。

temperature:控制生成随机性和多样性,范围(0,2)。建议该参数和top_p只设置1个。

stop:用于控制生成时遇到某些内容则停止。您可以传入多个字符串。

enable_search:是否参考搜索的结果,默认为false。

示例内容

使大模型检测Prompt中是否存在错别字,并进行纠正。详细内容参数值参考下方图片。

image

历史对话一键继承

新增对比模型时,一键继承已有模型历史对话,保持History消息不变的情况下,查看后续对话效果对比。

image