常见问题-大模型服务平台百炼(Model Studio)-阿里云帮助中心

本文档汇总了在使用阿里云百炼大模型服务平台时遇到的常见问题及其解答。

计费相关

阿里云百炼平台中模型服务中各模型的收费单价是什么？
详情请参见模型列表与价格与计费项。

模型部署的费用是如何计算的？

如何进行模型部署，请参见：模型部署简介

计费方式

按资源占用时长计费

按模型调用量计费

计费公式

费用 = 资源占用时长 × 资源数量 × 单价

支持模型丰富

费用 = 调用消耗量 × 调用单价

单价与模型推理（调用）单价相同

计费说明

适合对大模型推理服务有低延迟、高SLA需求的场景。

适合对模型训练的结果进行快速验证。

完整部署费用明细请查看模型部署计费。

通义千问大模型训练单价计费是什么？

文本生成模型-通义千问

计费方式

按训练的数据量计费

计费公式

模型训练费用 = （训练数据 Token 总数 + 混合训练数据 Token 总数）× 循环次数 × 训练单价（最小计费单位：1 token）

您可以查看模型训练控制台底部的预估训练费用，并单击计算详情，查看训练 Token 总数、循环次数和训练单价。

通义千问

模型服务	模型规格	价格
通义千问2.5-72B	qwen2.5-72b-instruct	0.15元/千Token
通义千问2-开源版-72B	qwen2-72b-instruct
通义千问1.5-开源版-72B	qwen1.5-72b-chat
通义千问-Plus-0723	qwen-plus-0723

通义千问3-32B	qwen3-32b	0.04 元/千Token

通义千问3-14B	qwen3-14b	0.03元/千Token
通义千问2.5-32B	qwen2.5-32b-instruct
通义千问2.5-14B	qwen2.5-14b-instruct
通义千问1.5-开源版-14B	qwen1.5-14b-chat
通义千问-Plus	qwen-plus
通义千问Turbo	qwen-turbo
通义千问-Turbo-0624	qwen-turbo-0624

通义千问3-8B	qwen3-8b	0.006元/千Token
通义千问2.5-7B	qwen2.5-7b-instruct
通义千问2-开源版-7B	qwen2-7b-instruct
通义千问1.5-开源版-7B	qwen1.5-7b-chat

通义千问VL

模型服务	模型规格	价格
通义千问VL-Max-0201	qwen-vl-max-0201	0.15元/千Token
通义千问VL-Plus	qwen-vl-plus	0.03元/千Token

通义千问3-VL-8B-Instruct	qwen3-vl-8b-instruct	0.012元/千Token
通义千问3-VL-8B-Thinking	qwen3-vl-8b-thinking	0.012元/千Token

通义千问2.5-VL-72B	qwen2.5-vl-72b-instruct	0.05 元/千Token
通义千问2.5-VL-32B	qwen2.5-vl-32b-instruct	0.02 元/千Token
通义千问2.5-VL-7B	qwen2.5-vl-7b-instruct	0.01 元/千Token

目前是否有预付费相关的服务？
部分模型支持预付费服务，详情请参见节省计划与资源包。
后付费的账单是月结算吗？
按小时出账，按月结算。
如何查询扣款项及明细？
请前往费用与成本查看。
已经消费的金额，如何申请开票？
登录费用与成本控制台，进入发票管理页面，点击开具发票页签。按照需求进行申请开票即可。
开通服务时提示“您的账户可用额度小于0，请先充值后再尝试购买”，应该怎么办？
您需要保证阿里云账户余额不小于0元，才能成功开通服务。

API/SDK相关

Completion API 调用报错提示“参数缺失”，错误码“100004”，是什么问题？

缺少必须参数，如果必须参数没有缺失，则检查参数格式书写是否正确。

正确示例如下：

curl --location 'https://bailian.aliyuncs.com/v2/app/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer 85763*************cf050f' \
--data '{
"RequestId":"B8265C3E-9248-56C0-8665-A37A12F06F6B",
"AppId":"3cc760a7ef5d47d09255dd28b06b94d8",
"Prompt":"今天深圳天气如何？",
"User":"1",
"Bot":"1"
}'

如何查看错误码信息？
阿里云百炼模型服务的API调用将返回状态码以标识调用结果。详情及解决方案请参见错误信息。
如何安装SDK?
阿里云百炼目前支持Java和Python语言的SDK。详情请参见安装SDK。
Assistant API 调用 function call ，用户需要依次调用两个本地函数，现在支持吗？
a.目前不支持分别调用两个函数。
b.手动创建两个Assistant API，分别分配两个Assistant API的使用返回。
Assistant API 有memory相关的能力吗?
当前暂不支持memory配置功能。
doc_reference_type 参数设置后不生效？
doc_reference_type 参数只在旧版本应用中生效，新版本应用中直接在应用操作页面开启展示答案来源按钮即可。

产品相关

如何开通阿里云百炼服务？
登录阿里云账号，访问阿里云百炼大模型服务平台。在首页/模型广场/应用广场，均可点击开通模型服务，按需开通即可。详细内容请查看：产品开通。
开通阿里云百炼服务后如何关闭？
目前，阿里云百炼服务开通后暂不支持关闭。如果您通过API来调用模型/应用，您只需要在控制台的API-KEY（北京）或API-KEY（新加坡）页面中删除 API-KEY 即可避免后续的调用。
如何体验大模型服务？
可通过模型体验中心进行体验，详细内容请查看：模型体验介绍。
阿里云百炼和通义千问的区别是什么？
阿里云百炼是一个大模型服务平台，提供包括通义千问系列在内的多种大模型。
我的产品接入了通义千问大模型，需要上架到微信小程序等其他应用商店，需要提供合作协议用于上架产品，应该怎么申请？
a.备案号获取流程请查看应用合规备案；
b.如需申请通义千问系列模型的合作协议，请提交阿里云工单进行申请。
如何实现业务数据隔离，使不同用户的数据之间不关联？
可以通过主账号给不同子账号授予不同的业务空间权限，不同业务空间的数据互不影响，存在隔离。详细操作内容点击业务空间管理查看。
阿里云百炼是否保存模型调用时产生的数据？
阿里云严格保护数据隐私，绝不会将您的数据用于模型训练。同时，您在构建应用或训练大模型过程中传输的数据都会经过加密，确保数据安全。
根据相关法律法规要求，阿里云百炼将存储模型与应用调用时产生的数据。详情请参见《阿里云百炼服务协议》中关于数据处理、隐私和安全的条款。

模型中心

完形填空词的数据能作为训练题吗？
可以的，可以通过上传训练集时，指定好问题内容及答案，引导大模型学习。可以点击自定义模型最佳实践参考。
目前阿里云百炼只能训练文字吗？图片可以训练吗？
目前已支持图片训练，qwen-vl-plus模型支持训练微调。
使用高阶模型微调，低阶模型做能力下沉，是想做蒸馏吗？
该技术通过微调高阶模型获取强大知识，然后将其转移至低阶模型，实现模型压缩与性能优化，使得低阶模型在保持小巧、高效的同时，获得接近或超越高阶模型的性能。
所谓大模型参数是怎么存储的？
您可以从魔搭社区下载开源模型，其结构通常在JSON文件中定义。通常需要使用开源的Python库来解析这些文件，其中包含了向量信息，这有助于理解其存储过程。
语料数据集的多样性怎么定义？
语料数据集的多样性是指其在语言特征、内容主题、文本类型、写作风格、语言变体、作者背景、时间跨度等多个维度上体现出的丰富程度和差异性，旨在真实反映语言的实际使用情况，提升NLP模型的泛化能力和对多元应用场景的适应性。
个人使用大模型训练时，qwen-turbo和qwen-max应该怎么选？
qwen-turbo注重速度与资源效率，适合对响应速度和部署便捷性有较高要求的场景；qwen-max则聚焦顶级性能与全面知识，适用于对模型精度和处理复杂任务能力有严格要求的环境。其中qwen-turbo的费用要比qwen-max低。根据您的具体需求和条件权衡，选择最适合自己的模型版本。也可以查看模型介绍：通义千问介绍了解具体差异。
模型训练中的自定义模型怎么上传？
模型调优中的自定义模型是指您已训练完成的模型，想要二次训练时，所选择的自定义模型。若是您自己在本地训练的模型不支持上传。
训练完的开源模型是否支持导出？
目前不支持。
通义千问系列模型支持多少种语言？
14种，分别是中文、英文、阿拉伯语、西班牙语、法语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、印度尼西亚语。
当前模型可以对接结构化数据吗？比如MySQL和hive等。
当前不支持。但已经在开发中，优先对接RDS服务。
通义千问升级后，企业大模型需要重新训练么？
不一定。是否以及何时进行企业大模型的重新训练，取决于客户自己。如果训练出来的模型，效果在客户场景中表现良好，就没必要再训练一遍。基模型的升级，在客户的应用场景会带来什么样的变化，是无法预知的，需要客户用我们的效果评估工具进行评估（如果客户判断需要）。
发现阿里云百炼上的base model模型，有时候模型自己会重复说话，并且在base model上进行微调后，这种现象发现会更严重一些，是什么原因？
这种是大模型的幻觉问题，当你输入的问题大模型没有知识回答的时候就可能出现。如果在base model上训练后更严重，就是没有训练好，训练效果与训练数据质量、多样性、数据等都有关系。
我们正在训练一个垂直领域的模型，如果SFT阶段只用领域数据，不混入通义原始的SFT数据，是否垂直领域的数据越多越容易过拟合，并导致回答重复啰嗦？有什么最佳实践建议吗？
仅使用垂直领域数据进行SFT，确实可能会导致模型遗忘原有的通用知识。
为了准备高质量的领域SFT数据，请注意：
- 任务定义清晰：避免同一个输入（prompt）对应模棱两可的答案。
- 数据质量高：答案应准确、简洁，直接回答问题，避免冗余和无关的“废话”。
- 数据多样性：同一语义可以用多种不同的prompt来表达，以避免模型只学会响应单一的模式。高质量的训练数据通常需要多次迭代优化。
在训练的时候发现，数据量少的情况下，比如100条左右，循环次数越大效果越好。但在数据量多的情况下比如1000条以上，循环次数越多越容易过拟合。请问这个超参配置和数据配比，有什么最佳实践？
为获得理想的模型效果，训练数据在保证高质量的同时应尽可能丰富，尤其是在处理复杂任务时。循环次数等超参数并无固定规律，需根据具体任务通过实验来确定。例如，在处理包含数千条数据的复杂任务时，训练通常需要20轮左右。另外，评估大模型不应仅通过损失（loss）判断是否过拟合。与传统模型不同，即便loss显示过拟合，大模型的实际效果仍可能提升，因此最终效果需以人工评估为准。
请问Qwen3、Qwen-Max等模型的文字生成速度对所有用户都是固定的吗，有没有调速的途径？
生成速度不是固定的，它会受到当前服务的整体负载和您的请求并发情况等因素的影响。
模型限流触发后，一般需要等多长时间再次尝试呢？
等待时间取决于您的具体限流值（RPS/RPM）。例如，如果您的限流是120 RPM（每分钟查询数），即每秒2次请求。如果您在0.2秒内连续提交了2次请求，第3次请求就会被限流，您需要等待大约0.8秒后才能再次成功提交。

如何联系我们

如有业务合作方面的场景，应该怎么联系？
请联系阿里云官方服务热线：4008013260或通过官网-售前咨询进一步沟通。
产品使用方面的问题如何反馈？
请您登录阿里云官网，通过官网-售后服务进行反馈。