模型体验介绍

本篇内容介绍模型体验和模型调试。

模型体验

支持选择多个模型同时体验,快速对比不同模型的效果,最多同时选择3个模型,支持差异化模型配置及重复模型选择。

image

说明
  • 为了保障模型的正常使用和输出质量,模型体验中心不同模型的文本输入长度限制不同,例如Qwen-Long模型输入Token限制为2k个。如果您需要输入更长的文本,建议使用API调用方式,具体操作请参见API详情

  • 关于模型输入输出限制Token的具体规则,以及各大模型收费标准,请参见模型列表

  • 关于Token的计算方法,请参见Token是怎么计算的

示例内容

提问:阿里云百炼大模型是什么

下方图片展示了不同大模型生成的答案。

image

模型调试

支持对文本模型的模型配置和输入模式进行调试,并透明地查看模型输出结果。

对输入模式进行调试

对输入模式进行调试,以便于开发者调试模型的效果。

输入模式包括Prompt模式及Message模式。其中,Prompt模式更侧重于单次的文本生成,而Message模式则适用于需要跟踪对话历史的多轮对话场景。

  • Prompt模式:在Prompt模式下,您直接向模型提供一段文本作为输入,这段文本即为Prompt,模型根据Prompt生成响应。Prompt可以包含指令、问题、上下文等信息,指导模型生成特定格式或内容的回复。

  • Message模式:Message模式更适用于对话场景。它通过一系列的Message(消息)来构建对话历史,每个Message包括角色(如system、user、assistant)和内容。模型基于整个对话历史生成回复,能够保持对话的连贯性和上下文的一致性。

image

对模型配置进行调试

对模型配置进行调试,以便于开发者对模型配置差异化效果进行对比。支持top-p、system、自定义随路参数及自定义停止符等多种自定义模型配置。

不同模型的参数不同,请以界面实际显示为准。
  • system:系统人设,例如“你是一个AI助手”。

  • top_p:控制核采样方法的概率阈值,取值越大,生成的随机性越高。

  • temperature:控制生成随机性和多样性,范围(0,2)。建议该参数和top_p只设置1个。

  • stop:用于控制生成时遇到某些内容则停止。您可以传入多个字符串。

  • enable_search:是否参考搜索的结果,默认为false。

示例内容

使大模型检测Prompt中是否存在错别字,并进行纠正。详细内容参数值参考下方图片。

image

历史对话一键继承

新增对比模型时,一键继承已有模型历史对话,保持History消息不变的情况下,查看后续对话效果对比。

image