文生图

本文介绍图像生产(imageenhan)类目下的文生图GenerateImageWithText的语法及示例。

服务说明

由于产品业务和安全合规调整,文生图服务将于2025年01月20日起停止提供服务,后续不再支持新老用户开通接入及调用服务。用户提前切换去调用通义万相服务。如果对文生图API服务使用有疑问,可通过搜索钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。

功能描述

依托达摩院自研文生图大模型,通过知识重组与可变维度扩散模型加速收敛并提升最终生成图片, 输入描述文本,即可返回符合文本描述的2D图像,支持中英双语输入,您可以通过API实现服务调用。

说明 阿里云视觉智能开放平台视觉AI能力API接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。

应用场景

  • 图片设计:根据特定prompt输入,为设计师提供素材和创作灵感,提升设计成图的效率。
  • 内容创作:根据内容工作者的文字内容快速生成人物、背景、封面、动漫、游戏等创意内容。

特色优势

  • 场景支持广:分辨率支持较为灵活,支持主流设计场景的分辨率设置。
  • 适用范围广:能基于任意中英文文本描述进行推理,生成图像。
  • 生成效果佳:在非现实、朋克机甲等类型的图片生成效果领先。

计费说明

关于文生图的计费方式及报价,请参见计费介绍

调用步骤

该能力为异步能力,需分两步进行调用。

第一步调用GenerateImageWithText接口提交任务,请求成功后,得到一个任务ID。

第二步调用GetAsyncJobResult接口查询结果,根据任务ID查询任务执行状态和结果。如果任务还在处理中,可稍等一段时间后再进行查询。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求参数

名称

类型

是否必选

示例值

描述

Action String GenerateImageWithText

系统规定参数。取值:GenerateImageWithText

Text String 一只戴着太阳镜的小松鼠在演奏吉他

文本内容,支持中英文,中文不超过75个字,英文不超过75个字母,超过部分会自动截断。

建议文本内容尽可能详细准确,详细的文本描述内容有助于获得更佳的图片生成效果。

Resolution String 1024*1024

生成的图像分辨率。支持512*512、1024*1024、1024*768、768*1024、720*1280和1280*720像素,默认1024*1024像素。

Number Integer 1

图片生成数量。支持1~4张,默认1张。

返回数据

名称

类型

示例值

描述

RequestId String 7574ee8f-38a3-4b1e-9280-11c33ab46e51

请求ID。

Data Object

返回的结果数据内容。该数据需要在异步任务执行成功后,通过调用GetAsyncJobResult接口,对其Result字段进行JSON反序列化之后得到。

ImageUrls Array of String http://vibktprfx-prod-prod-gen-model-cn-shanghai.oss-cn-shanghai.aliyuncs.com/text2image/cv_diffusion_text-to-image-synthesis_results/images/42d57dec8fe011ed9f3dde652e7536a6_1.jpg?Expires=1673244687&OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&Signature=JxAFHGKJbyIq9EUxa6BZzWj1hw****

输出图像的URL。

说明 该URL地址为临时地址,有效期为30分钟,过期后将无法访问。若需要长时间或者永久保存文件,请在30分钟内访问URL地址,下载文件转存到自己的OSS或者其他存储空间。
Message String 该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。

提交异步任务后的提示信息。

查询结果

该接口为异步接口,当前并未返回真实的请求结果,您需要通过返回的RequestId调用GetAsyncJobResult接口来获取该接口的真实请求结果。详情请参见GetAsyncJobResult

SDK参考

阿里云视觉AI图像生产类目下的文生图能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像生产(imageenhan)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见SDK总览

示例

请求示例

http(s)://imageenhan.cn-shanghai.aliyuncs.com/?Action=GenerateImageWithText      //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html
&Text=一只戴着太阳镜的小松鼠在演奏吉他
&Resolution=1024*1024
&Number=1
&公共请求参数

正常返回示例

XML格式

HTTP/1.1 200 OK
Content-Type:application/xml

<GenerateImageWithTextResponse>
    <RequestId>7574ee8f-38a3-4b1e-9280-11c33ab46e51</RequestId>
    <Message>该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。</Message>
</GenerateImageWithTextResponse>

JSON格式

HTTP/1.1 200 OK
Content-Type:application/json

{
  "RequestId" : "7574ee8f-38a3-4b1e-9280-11c33ab46e51",
  "Message" : "该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。"
}

返回示例补充说明

//查询结果:请求示例
http(s)://imageenhan.cn-shanghai.aliyuncs.com/?Action=GetAsyncJobResult
&JobId=E75FE679-0303-4DD1-8252-1143B4FA8A27
&<公共请求参数>

//查询结果:返回示例
{
  "RequestId" : "43A0AEB6-45F4-4138-8E89-E1A5D63200E3",
  "Data" : {
    "Status" : "PROCESS_SUCCESS",
    "JobId" : "186AC396-0EEC-46F1-AAA1-BF3585227427",
    "Result" : "{\"ImageUrls\":[\"http://vibktprfx-prod-prod-gen-model-cn-shanghai.oss-cn-shanghai.aliyuncs.com/text2image/cv_diffusion_text-to-image-synthesis_results/images/42d57dec8fe011ed9f3dde652e7536a6_1.jpg?Expires=1673244687&amp;OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&amp;Signature=JxAFHGKJbyIq9EUxa6BZzWj1hw****\"]}"
  }
}

//Result反序列化
{
  "ImageUrls" : ["http://vibktprfx-prod-prod-gen-model-cn-shanghai.oss-cn-shanghai.aliyuncs.com/text2image/cv_diffusion_text-to-image-synthesis_results/images/42d57dec8fe011ed9f3dde652e7536a6_1.jpg?Expires=1673244687&amp;OSSAccessKeyId=LTAI4FoLmvQ9urWXgSRp****&amp;Signature=JxAFHGKJbyIq9EUxa6BZzWj1hw****"]
}

错误码

关于文生图的错误码,详情请参见常见错误码

版权说明

  • ⽣成图⽚归属于谁?

    我们为您提供的是图⽚⽣成技术服务,在您购买产品并⽀付调⽤API技术服务费后,⽣成图⽚的著作

    权将永久归您所有。您可⽤于商业⽤途,并⾃⾏负责⽣成图⽚的使⽤⻛险及合规问题,我们对此不承

    担任何法律责任。

  • 图⽚是如何⽣成的?

    图⽚与您输⼊的内容有关,并通过深度合成算法⾃动⽣成,本服务算法是根据开源数据集及互联⽹的

    公开信息积累训练⽽成。因此,我们对⽣成图⽚的准确性、完整性和功能性不做任何保证,亦不承担

    任何法律责任。

  • 图⽚引发不适该怎么办?

    本服务⽣成的所有内容均由AI模型⾃动⽣成,我们在训练过程中已通过将训练数据持续过滤来提升

    内容理解和⽣成的准确性,但仍不排除其中有部分信息存在⼀定的敏感性、不合理或导致理解歧义的

    问题存在,可能会引发您的不适。

    您可以通过钉钉群(23109592)联系我们,我们将及时联系您并采取合理有效的处理措施。

安全声明

  • 请确保上传的图片或文件来源符合相应的法律法规。
  • 通过体验调试上传的临时文件有效期为1小时,在24小时后会被系统自动清理删除。