新增模型公告

本文介绍近期新上架的模型。

新增模型列表

新增模型类型

上架时间

模型规格

功能说明

视觉理解

2025-01-13

qwen-vl-plus-2025-01-02

  • 相较于qwen-vl-plus-0809模型,大幅提升指令跟随、图像理解和数学能力。使用方法请参见视觉理解

文生视频

2025-01-08

wanx2.1-t2v-turbo

wanx2.1-t2v-plus

  • 一句话生成视频。

  • 具备强大的指令遵循能力,支持大幅度复杂运动、现实物理规律还原,生成的视频呈现丰富的艺术风格及影视级画面质感。使用方法请参见文生视频

文生图

2025-01-08

wanx2.1-t2i-turbo

wanx2.1-t2i-plus

视觉理解

2025-01-07

qwen-vl-max-2024-12-30

  • 该模型丰富了知识库,图像识别和理解能力进一步提升,能够解析复杂的视觉内容。使用方法请参见视觉理解

语音识别

2025-01-02

qwen-audio-asr

qwen-audio-asr-latest

qwen-audio-asr-2024-12-04

  • 通义千问ASR是基于Qwen-Audio训练,专用于语音识别的模型,目前支持的语言有:中文、英文。使用方法请参见语音识别

视觉推理

2024-12-25

qvq-72b-preview

  • 专注于提升视觉推理能力,尤其在数学推理领域。使用方法请参见视觉理解

多语言翻译

2024-12-25

qwen-mt-plus

qwen-mt-turbo

  • Qwen-MT模型是基于通义千问模型优化的机器翻译大语言模型,擅长中英互译、中文与小语种互译、英文与小语种互译,小语种包括日、韩、法、西、德、葡(巴西)、泰、印尼、越、阿等26种。在多语言互译的基础上,提供术语干预、领域提示、记忆库等能力,提升模型在复杂应用场景下的翻译效果。详情请参见翻译能力

视觉理解

2024-12-18

qwen2-vl-72b-instruct

  • 在多个视觉理解基准测试中取得了最先进的成绩,显著增强多模态任务的处理能力。使用方法请参见视觉理解

意图理解

2024-12-12

tongyi-intent-detect-v3

  • 通义意图理解模型,能够在百毫秒级时间内快速、准确地解析用户意图,并选择合适工具来解决用户问题。详情请参见意图理解

声动人像

2024-12-10

videoretalk

  • 支持根据人物视频和音频生成对口型视频,详情请参见快速开始

舞动人像

2024-12-10

animate-anyone-gen2

animate-anyone-detect-gen2

animate-anyone-template-gen2

  • 分别提供人物图片合规检测、人物动作模板生成与人物视频生成能力,依次调用这三个模型可生成人物舞蹈视频。详情请参见快速开始

llama系列

2024-12-09

llama3.3-70b-instruct

音频理解

2024-12-09

qwen-audio-turbo-latest

qwen-audio-turbo-2024-12-04

  • 新增的模型,相较于qwen-audio-turbo-2024-08-07版本,大幅提升语音识别准确率,并新增了语音聊天能力。详情请参见音频理解

推理模型

2024-11-28

qwq-32b-preview

  • 本模型专注于增强 AI 推理能力。详情请参见QWQ

2024-11-28

qwen-plus-2024-11-25

qwen-plus-2024-11-27

  • 相较于qwen-plus-0919模型中英文回复详实程度显著提升,更加符合用户偏好;模型角色扮演能力显著增强;模型中文文本创作能力显著提升;中英文指令遵循能力提升;修复了RAG场景下引用角标的生成问题。详情请参见通义千问-Plus

2024-11-15

qwen-turbo-2024-11-01