阿里云百炼提供千问及第三方模型服务,覆盖文本、图像、音频、视频等多种模态。
图像与视频
理解
分析图片和视频内容,返回文本描述或结构化结果
查看更多 →
生成
通过文本或图片生成图像与视频,支持编辑、参考与高分辨率输出
查看更多 →
音频与语音
语音合成
适用于有声阅读、语音播报、虚拟人等场景
查看更多 →
语音识别
专业 ASR 与大模型两种方案,按精度与灵活性选择
查看更多 →
语音转语音
端到端语音对话,无需分别调用 ASR 和 TTS
查看更多 →
查看所有模型
前往模型广场查看所有千问、三方、领域及历史版本模型。