模型下线机制说明-大模型服务平台百炼-阿里云-阿里云帮助中心

为优化资源利用和确保用户使用最新、最优模型，阿里云百炼平台将根据模型迭代升级情况不定期下线历史模型。本文将为您介绍模型下线机制。

通知机制

通过短信、邮件、站内信、官网公告等方式。

短信、邮件、站内信仅面向近3个月有待下线模型调用记录的用户。

自下线通知发布之日起，将逐步缩减待下线模型的QPM（每分钟调用次数）和TPM（每分钟消耗Token数）。对于申请过扩容的模型，会先恢复至默认限流数据后再进行缩减。在此过程中，模型API接口、控制台上的相关功能均保持正常使用。
自模型正式下线之日起：
- 模型推理：停止支持模型推理服务，已创建的调用该模型的应用和服务将无法返回结果。
- 模型调优及模型部署：不再支持基于下线模型进行新的调优和部署操作（部分模型的调优与部署功能可能在模型下线后仍可正常使用，具体请以下线通知为准）。已经训练和部署的模型不受影响。
- 控制台功能及官方文档：模型相关的控制台功能（模型广场、模型体验等）、官方文档将同步下线。

以下是2026年3月30日已下线的模型。

类别	模型名称	下线时间	替代模型
千问Audio	qwen-audio-asr	2026年3月30日00:00:00	qwen3-asr-flash
	qwen-audio-asr-latest		qwen3-asr-flash
	qwen-audio-chat		qwen3-omni-flash
	qwen2-audio-instruct		qwen3-omni-flash
千问2-开源版	qwen2-57b-a14b-instruct		qwen3-235b-a22b
	qwen2-72b-instruct
	qwen2-7b-instruct
	qwen2-1.5b-instruct
	qwen2-0.5b-instruct
千问1.5	qwen1.5-110b-chat		qwen3-235b-a22b
	qwen1.5-72b-chat
	qwen1.5-32b-chat
	qwen1.5-14b-chat
	qwen1.5-7b-chat
	qwen1.5-1.8b-chat
	qwen1.5-0.5b-chat
千问Math	qwen2.5-math-1.5b-instruct		qwen-math-plus
千问Coder	qwen2.5-coder-3b-instruct		qwen-coder-plus
	qwen2.5-coder-1.5b-instruct
	qwen2.5-coder-0.5b-instruct
千问VL	qwen2-vl-72b-instruct		qwen3.5-flash
	qwen2-vl-7b-instruct
	qwen2-vl-2b-instruct
	qwen-vl-v1
	qwen-vl-chat-v1
第三方模型	baichuan2-turbo		qwen-flash
	abab6.5s-chat
	abab6.5g-chat
	abab6.5t-chat
NLU	opennlu-v1		qwen3.5-flash
图像生成	stable-diffusion-v1.5		qwen-image-plus、z-image-turbo、wan2.6-t2i
	stable-diffusion-xl
	stable-diffusion-3.5-large
	stable-diffusion-3.5-large-turbo
	flux-dev
	flux-merged
	flux-schnell
Llama 4	llama-4-scout-17b-16e-instruct		qwen3.5-flash
Llama 4	llama-4-maverick-17b-128e-instruct		qwen3.5-flash

以下是2026年1月30日已下线的模型。关于模型下线的详细说明，请参见官网公告大模型服务平台百炼部分历史快照模型下线通知。

以下是2025年7月30日已下线的模型。关于模型下线的详细说明，请参见官网公告【大模型服务平台百炼】历史模型下线通知。

以下是2025年7月2日已下线的模型。关于模型下线的详细说明，请参见官网公告大模型服务平台阿里云百炼部分历史模型下线通知。

以下是2025年5月8日已下线的模型。关于模型下线的详细说明，请参见官网公告大模型服务平台阿里云百炼部分历史快照模型下线通知。

类别	模型名称	下线时间	替代模型
文本生成-千问	qwen-max-2024-01-07 又称qwen-max-0107	2025年5月8日00:00:00	qwen-max
	qwen-plus-2024-06-24 又称qwen-plus-0624		qwen-plus
	qwen-plus-2024-02-06 又称qwen-plus-0206		qwen-plus
	qwen-turbo-2024-02-06 又称qwen-turbo-0206		qwen-turbo
	qwen-vl-max-2024-02-01 又称qwen-vl-max-0201		qwen-vl-max
文本生成-千问-开源版	qwen-72b-chat		qwen2.5-72b-instruct
	qwen-14b-chat		qwen2.5-14b-instruct
	qwen-7b-chat		qwen2.5-7b-instruct
	qwen-1.8b-chat		qwen2.5-1.5b-instruct
	qwen-1.8b-longcontext-chat		qwen2.5-1.5b-instruct
	qwen2-math-72b-instruct		qwen2.5-math-72b-instruct
	qwen2-math-7b-instruct		qwen2.5-math-7b-instruct
	qwen2-math-1.5b-instruct		qwen2.5-math-1.5b-instruct
幻影人像Motionshop视频生成模型	motionshop-video-detect		可使用animate-anyone-gen2的“按视频背景生成”功能，达到近似效果
	motionshop-gen3d
	motionshop-synthesis

类别	模型名称	下线时间	替代模型
文本生成-千问	qwen-max-1201	2024年4月22日00:00:00	qwen-max