本文介绍模型相关公告和新上架的模型。
关于阿里云百炼应用的产品动态,请参见产品更新公告。
公告通知
模型动态
新增模型类型 | 上架时间 | 模型规格 | 功能说明 |
声音复刻 | 2025-04-24 | cosyvoice-v2 | 用户仅需提供10~20秒的音频,即可迅速生成高度相似且听感自然的定制声音。声音复刻 |
视觉理解 | 2025-04-18 | qwen-vl-max-2025-04-08 | 视觉理解模型。数学和推理能力有所提升,回复风格面向人类偏好进行调整,模型回复详实程度和格式清晰度明显改善。视觉理解 |
图生视频 | 2025-04-18 | wanx2.1-kf2v-plus | 基于输入的首帧和尾帧图片,模型能够根据提示词生成一段丝滑流畅的动态视频。首尾帧生视频 |
视觉理解 | 2025-04-04 | qwen-vl-max-2025-04-02 | 视觉理解模型。在解决复杂数学问题方面,准确性显著提高,回复风格面向人类偏好进行大幅调整,尤其是数学、逻辑推理、知识问答等客观类问题,模型回复详实程度和格式清晰度明显改善。视觉理解 |
视觉推理 | 2025-03-28 | qvq-max、qvq-max-latest、qvq-max-2025-03-25 | 视觉推理模型。支持视觉输入及思维链输出,在数学、编程、视觉分析、创作以及通用任务上都表现出更强的能力。视觉推理 |
全模态 | 2025-03-26 | qwen-omni-turbo-2025-03-26 | 通义千问全新多模态理解生成大模型,支持文本、图像、语音与视频输入,并输出文本与音频,提供了4种自然对话音色。使用方法请参见全模态。 |
全模态 | 2025-03-26 | qwen2.5-omni-7b | 通义千问全新多模态理解生成大模型,支持文本、图像、语音与视频输入,并输出文本与音频,提供了2种自然对话音色。使用方法请参见全模态。 |
图像编辑 | 2025-03-25 | wanx2.1-imageedit | 通用图像编辑模型。通过一句话指令实现多样化的图像编辑功能,如扩图、去文字水印、图像修复、图像风格迁移等。通义万相-通用图像编辑 |
视觉理解 | 2025-03-24 | qwen2.5-vl-32b-instruct | 视觉理解模型。在数学问题的解答方面达到了接近Qwen2.5VL-72B的水平,回复风格面向人类偏好进行大幅调整,尤其是数学、逻辑推理、知识问答等客观类问题,模型回复详实程度和格式清晰度明显改善。视觉理解 |
推理模型 | 2025-03-06 | qwq-plus、qwq-plus-latest、qwq-plus-2025-03-05 | 基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。深度思考 |
开源推理模型 | 2025-03-06 | qwq-32b | 基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。深度思考 |
语音识别/翻译 | 2025-03-03 | gummy-realtime-v1 gummy-chat-v1 | Gummy大模型支持实时语音识别与翻译,能够精准识别中、英、日、韩等10种语言。此外,它还支持中、英、日、韩之间的互译,以及其他6种语言单向翻译成中文或英文。使用方法请参见实时语音识别。 |
图生视频 | 2025-02-25 | wanx2.1-i2v-turbo | 相较于wanx2.1-i2v-plus模型,turbo模型生成速度更快,耗时仅为plus模型的三分之一,性价比更高。使用方法请参见首帧生视频。 |
全模态 | 2025-02-14 | qwen-omni-turbo qwen-omni-turbo-latest qwen-omni-turbo-2025-01-19 | Qwen-Omni 系列模型支持输入多种模态的数据,包括视频、音频、图片、文本,并输出文本。使用方法请参见全模态。 |
文生文 | 2025-01-27 | deepseek-v3 deepseek-r1 | DeepSeek系列模型是由深度求索(DeepSeek)公司推出的大语言模型。
|
视觉理解 | 2025-01-27 | qwen2.5-vl-3b-instruct qwen2.5-vl-7b-instruct qwen2.5-vl-72b-instruct |
|
文生文 | 2025-01-27 | qwen-max-2025-01-25 qwen2.5-14b-instruct-1m qwen2.5-7b-instruct-1m |
|
图生视频 | 2025-01-22 | emoji-detect-v1 emoji-v1 |
|
文生文 | 2025-01-17 | qwen-plus-2025-01-12 |
|
图生视频 | 2025-01-17 | wanx2.1-i2v-plus |
|
文生图 | 2025-01-17 | wanx2.0-t2i-turbo |
|
视觉理解 | 2025-01-13 | qwen-vl-plus-2025-01-02 |
|
文生视频 | 2025-01-08 | wanx2.1-t2v-turbo wanx2.1-t2v-plus |
|
文生图 | 2025-01-08 | wanx2.1-t2i-turbo wanx2.1-t2i-plus |
|
视觉理解 | 2025-01-07 | qwen-vl-max-2024-12-30 |
|
语音识别 | 2025-01-02 | qwen-audio-asr qwen-audio-asr-latest qwen-audio-asr-2024-12-04 |
|
视觉推理 | 2024-12-25 | qvq-72b-preview |
|
多语言翻译 | 2024-12-25 | qwen-mt-plus qwen-mt-turbo |
|
视觉理解 | 2024-12-18 | qwen2-vl-72b-instruct |
|
意图理解 | 2024-12-12 | tongyi-intent-detect-v3 |
|
声动人像 | 2024-12-10 | videoretalk |
|
舞动人像 | 2024-12-10 | animate-anyone-gen2 animate-anyone-detect-gen2 animate-anyone-template-gen2 |
|
llama系列 | 2024-12-09 | llama3.3-70b-instruct |
|
音频理解 | 2024-12-09 | qwen-audio-turbo-latest qwen-audio-turbo-2024-12-04 |
|
文生文 | 2024-11-28 | qwq-32b-preview |
|
2024-11-28 | qwen-plus-2024-11-25 qwen-plus-2024-11-27 |
| |
2024-11-15 | qwen-turbo-2024-11-01 |
|