新增模型公告_大模型服务平台百炼(Model Studio)-阿里云帮助中心

本文介绍近期新上架的模型。

新增模型列表

新增模型类型	上架时间	模型规格	功能说明
视觉理解	2025-01-13	qwen-vl-plus-2025-01-02	相较于qwen-vl-plus-0809模型，大幅提升指令跟随、图像理解和数学能力。使用方法请参见视觉理解。
文生视频	2025-01-08	wanx2.1-t2v-turbo wanx2.1-t2v-plus	一句话生成视频。具备强大的指令遵循能力，支持大幅度复杂运动、现实物理规律还原，生成的视频呈现丰富的艺术风格及影视级画面质感。使用方法请参见文生视频。
文生图	2025-01-08	wanx2.1-t2i-turbo wanx2.1-t2i-plus	文生图V2系列模型为全面升级的通义万相文生图模型，推荐体验。
视觉理解	2025-01-07	qwen-vl-max-2024-12-30	该模型丰富了知识库，图像识别和理解能力进一步提升，能够解析复杂的视觉内容。使用方法请参见视觉理解。
语音识别	2025-01-02	qwen-audio-asr qwen-audio-asr-latest qwen-audio-asr-2024-12-04	通义千问ASR是基于Qwen-Audio训练，专用于语音识别的模型，目前支持的语言有：中文、英文。使用方法请参见语音识别。
视觉推理	2024-12-25	qvq-72b-preview	专注于提升视觉推理能力，尤其在数学推理领域。使用方法请参见视觉理解。
多语言翻译	2024-12-25	qwen-mt-plus qwen-mt-turbo	Qwen-MT模型是基于通义千问模型优化的机器翻译大语言模型，擅长中英互译、中文与小语种互译、英文与小语种互译，小语种包括日、韩、法、西、德、葡（巴西）、泰、印尼、越、阿等26种。在多语言互译的基础上，提供术语干预、领域提示、记忆库等能力，提升模型在复杂应用场景下的翻译效果。详情请参见翻译能力。
视觉理解	2024-12-18	qwen2-vl-72b-instruct	在多个视觉理解基准测试中取得了最先进的成绩，显著增强多模态任务的处理能力。使用方法请参见视觉理解。
意图理解	2024-12-12	tongyi-intent-detect-v3	通义意图理解模型，能够在百毫秒级时间内快速、准确地解析用户意图，并选择合适工具来解决用户问题。详情请参见意图理解。
声动人像	2024-12-10	videoretalk	支持根据人物视频和音频生成对口型视频，详情请参见快速开始。
舞动人像	2024-12-10	animate-anyone-gen2 animate-anyone-detect-gen2 animate-anyone-template-gen2	分别提供人物图片合规检测、人物动作模板生成与人物视频生成能力，依次调用这三个模型可生成人物舞蹈视频。详情请参见快速开始。
llama系列	2024-12-09	llama3.3-70b-instruct	新增第三方大模型llama3.3系列中70B参数的模型。详情请参见Llama模型（输入文本和图像）API参考。
音频理解	2024-12-09	qwen-audio-turbo-latest qwen-audio-turbo-2024-12-04	新增的模型，相较于qwen-audio-turbo-2024-08-07版本，大幅提升语音识别准确率，并新增了语音聊天能力。详情请参见音频理解。
推理模型	2024-11-28	qwq-32b-preview	本模型专注于增强 AI 推理能力。详情请参见QWQ。
	2024-11-28	qwen-plus-2024-11-25 qwen-plus-2024-11-27	相较于qwen-plus-0919模型中英文回复详实程度显著提升，更加符合用户偏好；模型角色扮演能力显著增强；模型中文文本创作能力显著提升；中英文指令遵循能力提升；修复了RAG场景下引用角标的生成问题。详情请参见通义千问-Plus。
	2024-11-15	qwen-turbo-2024-11-01	上下文长度扩展至一百万Token。详情请参见通义千问-Turbo。