AI写真:Go SDK使用说明

使用Go SDK调用AI写真的算法服务接口进行模型训练和写真制作。通过SDK,您可以定制LoRA模型,并根据模板制作写真。本文为您介绍使用Go SDK调用接口之前的准备工作以及使用示例。

前提条件

  • 已准备好Go环境。

  • 已准备好5-20张训练图片和1张模板图片,用于模型训练和写真制作。图片格式支持.jpg.jpeg.png等。

    • 如果进行单人写真制作,模板图片中包含单张人脸即可。多张训练图片中的人脸属于同一个人。

    • 如果进行多人写真制作,模板图片中需包含多张人脸,且人脸数量与模型训练的model_id数量一致。

    • 请确保图片的尺寸大于512×512像素。

准备工作

  1. 环境依赖:Go 1.18版本以上。

  2. Go本地安装SDK:

    • 创建mod go mod init 项目名

    • 运行go get github.com/aliyun/aliyun-pai-aiservice-go-sdk获取远程代码。

    • 在代码中使用import "github.com/aliyun/aliyun-pai-aiservice-go-sdk"引入SDK代码。

  3. 执行以下代码初始化Client。

    1. 使用以下Shell命令,将HOST,AppIdToken写入环境变量。在后续代码中会使用到这三个参数。

      export HOST="http://ai-service.ce8cc13b6421545749e7b4605f3d02607.cn-hangzhou.alicontainer.com"
      export AppId=xxx
      export Token=xxxxxxxxx

      参数

      描述

      HOST

      服务端地址:http://ai-service.ce8cc13b6421545749e7b4605f3d02607.cn-hangzhou.alicontainer.com

      AppId

      开通AI写真后,您可以直接在AI写真页面查看AppId。

      Token

      开通AI写真后,您可以直接在AI写真页面查看Token。

    2. 运行以下代码初始化Client

      host := os.Getenv("Host")
      appId := os.Getenv("AppId")
      token := os.Getenv("Token")
      
      client := sdk.NewClient(host, appId, token)

调用代码示例

AI写真是一个资源消耗量较大的服务,主要包括模型训练和写真制作两个环节。模型训练通常需要几分钟的响应时间,而写真制作则只需要数十秒即可完成。AI写真的接口调用流程图如下:

image

各个接口的请求、响应代码示例和端到端的请求代码示例如下:

核验请求(client.AIGCApi.AigcImageCheck)

  • 请求代码示例如下:

    package main
    
    import (
    	"fmt"
    	"log"
    	"os"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
      // 从环境变量中获得 HOST,AppId,Token 参数
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    
    	// 检查图片列表
    	images := []string{"https://train/0.jpg","https://train/1.jpg","https://train/2.jpg","https://train/3.jpg"}
    
    	response, err := client.AIGCApi.AigcImageCheck(images, "", nil)
    
    	fmt.Println(response)
    
    	if err != nil {
    		log.Fatal(err)
    		return
    	}
    
    	if response.Code != "OK" {
    		log.Fatal("response error:%v", response)
    		return
    	}
    
    	// 遍历图片检测结果
    	for _, result := range response.Data.CheckResults {
    		fmt.Printf("code=%d\tfrontal=%v\turl=%s\n", result.Code, result.Frontal, result.Url)
    	}
    }
    

    参数说明如下:

    参数名称

    参数说明

    类型

    images

    图片URL list,多个URL使用半角逗号(,)分隔。

    []string

  • 响应结果解析如下

    响应返回为一个AIGCImageCheckResponse对象,对象字段如下:

    参数名称

    参数说明

    类型

    RequestId

    请求流水号。

    string

    Code

    请求状态码,是否完成,OK或者error。

    string

    Message

    请求状态详细信息,成功为success,其他视具体返回内容。

    string

    Data

    返回数据详情。

    AIGCImageCheckData

    data字段说明: AIGCImageCheckData对象

    参数名称

    参数说明

    类型

    CheckResults

    代表输入每张图片的检测结果。 每个图片对应一个字典,每个字典一共有三个key,分别是url、messagefrontal,分别代表图片的URL、图片检测详情与是否为正面。

    List<AIGCImageCheckResult>

    CostTime

    本次API花费的服务端计算时长。

    float64

    Images

    核验的图片URL list。

    List<String>

    RequestId

    请求流水号(同上级request_id流水号)。

    String

    check_results字段: AIGCImageCheckResult

    参数名称

    参数说明

    类型

    Code

    请求状态码,是否完成,0或者1

    代表输入每张图片的检测结果。

    int

    Frontal

    图片检测详情与是否为正面。

    bool

    Message

    状态信息。

    string

    Url

    图片URL。

    string

    check_resultsmessage汇总:

    message

    状态码

    含义

    success

    1

    代表符合要求。

    Image decode error.

    2

    图像无法下载或者解码。

    Number of face is not 1.

    3

    人脸数量不为1。

    Image detect error.

    4

    人脸检测出错。

    Image encoding error.

    5

    人脸编码为特征向量出错。原因一般是无法检测到人脸。

    This photo is not the same person in photos.

    6

    如果不为上面的错误,只是这个错误,代表这张脸和其他脸不是同一张脸。

模型发起训练(client.AIGCApi.AigcImagesTrain)

  • 训练sd15

    package main
    
    import (
    	"fmt"
    	"log"
    	"os"
    	"time"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
      // 从环境变量中获得 HOST,AppId,Token 参数
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    
    	images := []string{"https://train/0.jpg","https://train/1.jpg","https://train/2.jpg","https://train/3.jpg"}
    
    	response, err := client.AIGCApi.AigcImagesTrain(images, "", nil)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	// 任务ID
    	jobId := response.Data.JobId
    	modelId := response.Data.ModelId
    	fmt.Println(jobId)
    
    	jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    	fmt.Println(jobResponse.Data.Job.Message)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	for {
    		jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    		fmt.Println(jobResponse.Data.Job.Result)
    		if err != nil {
    			log.Fatal("get job fail", err)
    		}
    
    		if jobResponse.Data.Job.State == sdk.JOB_STATE_WAIT {
    			fmt.Println("job running")
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_SUCCESS { // job success
    			fmt.Println(jobResponse)
    			fmt.Println("job success")
    			break
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_FAILED {
    			log.Fatal("job fail", err)
    			return
    		}
    
    		time.Sleep(30 * time.Second)
    	}
    	fmt.Println(modelId)
    
    }
    

    参数名称

    参数说明

    类型

    images

    训练的图片URL列表。

    []string

  • 训练SDXL

    SDXL需要首先联系您的商务经理开通服务后,通过指定模型名称来进行使用。

    SDXL同时支持人像训练场景loRA训练。

    二者的训练通过configure中的参数指定。

    package main
    
    import (
    	"fmt"
    	"log"
    	"os"
    	"time"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
      // 从环境变量中获得 HOST,AppId,Token 参数
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    
    	images := []string{"https://train/0.jpg","https://train/1.jpg","https://train/2.jpg","https://train/3.jpg"}
    
    	modelName := "train_xl"
    	configure := make(map[string]interface{}, 10)
    	configure["train_scene_lora_bool"] = false
    	configure["scene_lora_prompts"] = []string{"a photography of a woman with long blonde hair and a white dress",
    		"a photography of a woman in a pink dress posing for a picture",
    		"a photography of a woman in a black dress with a white background",
    		"a photography of a woman with a frilly collar and suspenders",
    		"a photography of a woman with a white dress and a white headpiece"}
    
    	response, err := client.AIGCApi.AigcImagesTrain(images, modelName, configure)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	// 任务ID
    	jobId := response.Data.JobId
    	modelId := response.Data.ModelId
    	fmt.Println(jobId)
    
    	jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    	fmt.Println(jobResponse.Data.Job.Message)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	for {
    		jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    		fmt.Println(jobResponse.Data.Job.Result)
    		if err != nil {
    			log.Fatal("get job fail", err)
    		}
    
    		if jobResponse.Data.Job.State == sdk.JOB_STATE_WAIT {
    			fmt.Println("job running")
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_SUCCESS { // job success
    			fmt.Println(jobResponse)
    			fmt.Println("job success")
    			break
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_FAILED {
    			log.Fatal("job fail", err)
    			return
    		}
    
    		time.Sleep(30 * time.Second)
    	}
    	fmt.Println(modelId)
    
    }
    

    参数名称

    参数说明

    类型

    images

    训练的图片URL列表。

    []string

    modelName

    模型名称,用SDXL需要设置为train_xl。

    string

    configure

    参数配置,默认为nil。

    map[string]interface{}

    configure内部参数名称

    参数说明

    类型

    是否必须

    默认值

    取值范围

    train_scene_lora_bool

    是否训练场景LoRA。

    bool

    False

    True, False

    scene_lora_prompts

    场景LoRA的提示词;

    训练场景LoRA必须输入,列表长度与imagesURL一致。

    []string

    []

  • 响应结果解析如下

    服务返回的是一个AIGCImageTrainResponse对象。

    参数名称

    参数说明

    类型

    RequestId

    请求流水号。

    string

    Code

    请求状态码,是否完成,OK或者error。

    string

    Message

    请求状态详细信息,成功为success,其他视具体返回内容。

    string

    Data

    返回数据详情。

    AIGCImageTrainData

    AIGCImageTrainData对象字段

    参数名称

    参数说明

    类型

    jobId

    任务ID。

    int32

    modelId

    本次模型训练的模型ID,为一串长度为36的字符串编码。

    string

    需要保存jobId来进行训练结果查询;

    需要保存modelId来对进行写真制作服务的请求。

训练结果查询(client.JobApi.GetAsyncJobWithId)

  • 请求接口示例如下

    package main
    
    import (
    	"fmt"
    	"log"
    	"os"
    	"time"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
    	// 从环境变量中获得 HOST,AppId,Token 参数
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    
    	// 任务ID
    	var jobId int32 = xxxxxx
    
    	for {
    		jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    		if err != nil {
    			log.Fatal("get job fail", err)
    		}
    
    		if jobResponse.Data.Job.State == sdk.JOB_STATE_WAIT {
    			fmt.Println("job running")
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_SUCCESS { // job success
    			fmt.Println(jobResponse)
    			fmt.Println("job success")
    			break
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_FAILED {
    			log.Fatal("job fail", err)
    			return
    		}
    
    		time.Sleep(30 * time.Second)
    	}
    
    }
    

    参数说明

    参数名称

    参数说明

    类型

    是否必须

    jobId

    请求服务时返回的job_id。

    int32

  • 响应结果解析如下

    服务返回的是一个 AsyncJobResponse对象,对象字段如下:

    参数名称

    参数说明

    类型

    RequestId

    请求流水号。

    string

    Code

    请求状态码,是否完成,OK或者error。

    string

    Message

    请求状态详细信息,成功为success,其他视具体返回内容。

    string

    Data

    返回数据详情。

    AsyncJobData

    AsyncJobData.Job字段AsyncJobResult字段解析

    参数名称

    参数说明

    类型

    State

    每张图片核验的结果。

    int32

    AppId

    账户AppId。

    string

    Message

    请求状态详细信息,成功为success,其他视具体返回内容。

    string

    Result

    模型返回结果。

    string

    模型训练完成后,Result返回说明:

    参数名称

    参数说明

    cost_time

    本次训练消耗的总时间。

    states

    每张图片核验的结果。

    代表输入每张图片的检测结果。 每个图片对应一个字典,每个字典一共有三个key,分别是url、messagefrontal,分别代表图片的URL,图片检测详情与是否为正面。

    model_id

    LoRA模型名称,同训练请求时获得的model_id。

    LoRA模型名称,等同于训练请求时获得的model_id,用于写真制作时输入。

写真制作请求

  • 单人写真制作请求接口(client.AIGCApi.AigcImagesCreate)

    • 预测sd15

      package main
      
      import (
      	"encoding/base64"
      	"log"
      	"os"
      
      	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
      )
      
      func main() {
        // 从环境变量中获得 HOST,AppId,Token 参数
      	host := os.Getenv("Host")
      	appId := os.Getenv("AppId")
      	token := os.Getenv("Token")
      
      	client := sdk.NewClient(host, appId, token)
      
      	modelID := "xxxxxxxxxxxxxxx"
      
      	templateImage := "https://template_case.png"
      
      	config := make(map[string]interface{}, 10)
      	config["lora_weights"] = 0.9
      	config["first_denoising_strength"] = 1
      	config["second_denoising_strength"] = 1
      	config["more_like_me"] = 1
      	config["crop_face_preprocess"] = false
      	config["apply_face_fusion_before"] = false
      	config["apply_face_fusion_after"] = false
      	config["color_shift_middle"] = false
      	config["color_shift_last"] = false
      	config["background_restore"] = true
      
      	response, err := client.AIGCApi.AigcImagesCreate(modelID, image, "", config)
      
      	if err != nil {
      		log.Fatal(err)
      	}
      
      	image_decode, _ := base64.StdEncoding.DecodeString(response.Data.Image)
      
      	f, err_2 := os.Create("test.jpg")
      	f.Write(image_decode)
      
      	if err_2 != nil {
      		log.Fatal(err)
      	}
      
      }
      

      参数名称

      参数说明

      类型

      是否必须

      modelID

      LoRA模型名称,需要输入训练获得的model-id。

      string

      templateImage

      模板图片的URL路径。

      string

      config

      模型返回配置,默认输入nil

      map[string]interface{}

      config内部参数

      config内部参数名称

      参数说明

      类型

      是否必须

      默认值

      取值范围

      lora_weights

      LoRA强度。

      float

      0.90

      0.5~1.0

      first_denoising_strength

      第一次图像重建的强度。

      float

      0.45

      0.0~1.0

      second_denoising_strength

      第二次图像重建的强度。

      float

      0.30

      0.0~1.0

      more_like_me

      更像我的强度。

      float

      0.50

      0.0~1.0

      crop_face_preprocess

      是否裁剪图像后进行重建,大图建议开启。

      bool

      True

      True, False

      apply_face_fusion_before

      是否进行第一次人像融合。

      bool

      True

      True, False

      apply_face_fusion_after

      是否进行第二次人像融合。

      bool

      True

      True, False

      color_shift_middle

      是否进行第一次颜色校正。

      bool

      True

      True, False

      color_shift_last

      是否进行第二次颜色校正。

      bool

      True

      True, False

      background_restore

      是否重建背景。

      bool

      False

      True, False

      skin_retouching_bool

      是否进行皮肤平滑。

      开启后会进行皮肤的平滑与变亮,一般会使得图片更好看,但可能会导致皮肤过白,关闭后可以提高皮肤的质感。

      bool

      False

      True, False

      photo_enhancement_bool

      是否进行人像增强。

      开启后会进行人像修复或者超分,用于提高生成图片质量。

      bool

      True

      True, False

      photo_enhancement_method

      人像增强方式。

      photo_fix则是进行图像修复,可能会导致一些失真但会修复不合理的地方,可能会失去一些皮肤的质感。

      super_resolution则仅进行图像超分,更大程度地保留原图。

      string

      photo_fix

      photo_fix, super_resolution

      makeup_transfer

      是否进行妆容迁移。

      开启后会进行妆容迁移,防止图片过素,但也可能导致图像有一些不像用户。

      bool

      False

      True, False

      makeup_transfer_ratio

      进行妆容迁移的强度。

      理论上,值越大,妆容迁移的比例就越大,生成的妆容也越像模板,但也可能导致图像有一些不像用户。

      float

      0.5

      0.0~1.0

      face_shape_match

      是否进行脸型的适配。

      开启后会减弱控制的强度,脸型与皮肤质感相比于之前会更加贴近用户。

      bool

      False

      True, False

      ipa_control

      是否进行ipa的控制。

      开启后会提高人像的相似度,但容易受到参考图片的影响。

      bool

      False

      True, False

      ipa_control_only

      开启后可以无需训练进行预测。

      开启后必须填入ipa_image_path。

      bool

      False

      True, False

      ipa_image_path

      参考人像的url。

      开启ipa_control_only后必须填写。

      string

      None

      可下载的url

      ipa_weight

      ipa的控制强度。

      理论上,值越大时出图越像用户,但值太大容易导致图像失真。

      float

      0.5

      0.0~1.0

      style_name

      用于设置生成的风格。

      真实或者漫画风格。

      string

      Realistic

      Realistic,

      Anime

      lcm_accelerate

      用于设置生成的风格,是否进行lcm加速。

      bool

      False

      True, False

      sharp_ratio

      锐化程度,适当的值可以提高清晰度。

      过高会导致图片失真。

      float

      0.15

      0.0~1.0

      t2i_prompt

      如果期望使用文生图功能,则需要在这里设置提示词。

      如果设置了t2i_prompt则可以不传入模板的URL路径。

      String

      None

    • 预测SDXL

      SDXL需要首先联系您的商务经理开通服务后,通过指定模型名称来进行使用。

      package main
      
      import (
      	"encoding/base64"
      	"log"
      	"os"
      
      	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
      )
      
      func main() {
        // 从环境变量中获得 HOST,AppId,Token 参数
      	host := os.Getenv("Host")
      	appId := os.Getenv("AppId")
      	token := os.Getenv("Token")
      
      	client := sdk.NewClient(host, appId, token)
      
      	modelID := "xxxxxxxxxxxx"
      
      	templateImage := "https://template_case.png"
      
      	modelName := "create_xl"
      	config := make(map[string]interface{}, 10)
      	// config["lora_weights"] = 0.9
      	// config["first_denoising_strength"] = 1
      	// config["second_denoising_strength"] = 1
      	// config["more_like_me"] = 1
      	// config["crop_face_preprocess"] = false
      	// config["apply_face_fusion_before"] = false
      	// config["apply_face_fusion_after"] = false
      	// config["color_shift_middle"] = false
      	// config["color_shift_last"] = false
      	// config["background_restore"] = true
      
      	response, err := client.AIGCApi.AigcImagesCreate(modelID, image, modelName, config)
      
      	if err != nil {
      		log.Fatal(err)
      	}
      
      	image_decode, _ := base64.StdEncoding.DecodeString(response.Data.Image)
      
      	f, err_2 := os.Create("test.jpg")
      	f.Write(image_decode)
      
      	if err_2 != nil {
      		log.Fatal(err)
      	}
      
      }
      

      参数名称

      类型

      参数说明

      modelID

      string

      LoRA模型名称,需要输入训练获得的model_id。当使用ipa_control_only模式时设置为""。

      templateImage

      string

      模板的URL路径。

      当使用scene_lora或者prompt生成时设置为"t2i_generate"。

      modelName

      string

      模型名称,使用SDXL则需要设置为create_xl。

      config

      map[string]interface{}

      模型返回配置configure,默认输入None。

      config内部参数

      config内部参数名称

      参数说明

      类型

      是否必须

      默认值

      取值范围

      lora_weights

      LoRA的应用强度。

      理论上,值越大时出图越像用户,但值太大容易导致图像失真。

      float

      0.90

      0.5~1.0

      first_diffusion_steps

      第一次diffusion的步数。

      不建议修改,过低会导致图像失真。

      int

      50

      20-50

      first_denoising_strength

      第一次图像重建的强度。

      人物脸部的重建强度,越大进行的重建越多,理论上越大时出图越像用户,但值太大会导致图片不协调。

      float

      0.45

      0.0~1.0

      second_diffusion_steps

      第二次diffusion的步数。

      不建议修改,过低会导致图像失真。

      int

      30

      20-50

      second_denoising_strength

      第二次图像重建的强度。

      人物脸部边缘的重建强度,值太大会导致图片不协调。

      float

      0.30

      0.0~1.0

      more_like_me

      更像我的强度。

      人像融合的比例,值越大越像本人,值太大会导致图片真实感降低。

      float

      0.60

      0.0~1.0

      crop_face_preprocess

      是否裁剪图像后进行重建,大图建议开启。

      不建议调整。

      bool

      True

      True, False

      apply_face_fusion_before

      是否进行第一次人像融合。

      开启后会进行人像融合,不开启会导致相似度降低。

      bool

      True

      True, False

      apply_face_fusion_after

      是否进行第二次人像融合。

      开启后会进行人像融合,不开启会导致相似度降低。

      bool

      True

      True, False

      color_shift_middle

      是否进行第一次颜色校正。

      开启后会进行颜色矫正,使得输出图片的肤色更像模板。不开启则不会矫正,存在色偏的可能。

      bool

      True

      True, False

      color_shift_last

      是否进行第二次颜色校正。

      开启后会进行颜色矫正,使得输出图片的肤色更像模板。不开启则不会矫正,存在色偏的可能。

      bool

      True

      True, False

      background_restore

      是否重建背景。

      开启后会进行背景重建,理论上会让图片更自然,但会改变背景并且增加耗时。

      bool

      False

      True, False

      skin_retouching_bool

      是否进行皮肤平滑。

      开启后会进行皮肤的平滑与变亮,一般会使得图片更好看,但可能会导致皮肤过白,关闭后可以提高皮肤的质感。

      bool

      False

      True, False

      photo_enhancement_bool

      是否进行人像增强。

      开启后会进行人像修复或者超分,用于提高生成图片质量。

      bool

      True

      True, False

      photo_enhancement_method

      人像增强方式:

      photo_fix则是进行图像修复,可能会导致一些失真,但会修复不合理的地方,可能会失去一些皮肤的质感。

      super_resolution则仅进行图像超分,更大幅度地保留原图。

      String

      photo_fix

      photo_fix, super_resolution

      makeup_transfer

      是否进行妆容迁移。

      开启后会进行妆容迁移,防止图片过素,但也可能导致图像有一些不像用户。

      bool

      False

      True, False

      makeup_transfer_ratio

      进行妆容迁移的强度。

      理论上值越大妆容迁移的比例就越大,生成的妆容也越像模板,但也可能导致图像有一些不像用户。

      float

      0.5

      0.0~1.0

      ipa_control

      是否进行ipa的控制。

      开启后会提高人像的相似度,但容易受到参考图片的影响。

      bool

      False

      True, False

      ipa_control_only

      开启后可以无需训练进行预测。

      开启后必须填入ipa_image_path。

      bool

      False

      True, False

      ipa_image_path

      参考人像的URL。

      开启ipa_control_only后必须填入。

      String

      None

      可下载的URL链接

      ipa_weight

      ipa的控制强度。

      理论上越大时出图越像用户,但值太大容易导致图像失真。

      float

      0.5

      0.0~1.0

      lcm_accelerate

      用于设置生成的风格,是否进行lcm加速。

      bool

      False

      True, False

      sharp_ratio

      锐化程度,适当的值可以提高清晰度。

      过高会导致图片失真。

      float

      0.15

      0.0~1.0

      scene_id

      如果期望使用scene lora则需要在这里设置scene id。

      scene id由训练获得,训练SDXL场景LoRA时返回model id即为scene id。

      String

      None

      t2i_prompt

      如果期望使用文生图功能则需要在这里设置提示词。

      如果设置了t2i_prompt则可以不传入模板的URL路径。

      String

      None

  • 多人写真制作请求接口(client.AIGCApi.AigcImagesCreateByMultiModelIds)

    package main
    
    import (
    	"encoding/base64"
    	"log"
    	"os"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
      // 从环境变量中获得 HOST,AppId,Token 参数
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    
    	modelIDs := []string{"xxxxxx", "xxxxxx"}
    
    	templateImage := "https://template_case.png"
    
    	config := make(map[string]interface{}, 10)
    	config["lora_weights"] = 0.9
    	config["first_denoising_strength"] = 1
    	config["second_denoising_strength"] = 1
    	config["more_like_me"] = 1
    	config["crop_face_preprocess"] = false
    	config["apply_face_fusion_before"] = false
    	config["apply_face_fusion_after"] = false
    	config["color_shift_middle"] = false
    	config["color_shift_last"] = false
    	config["background_restore"] = true
    
    	response, err := client.AIGCApi.AigcImagesCreateByMultiModelIds(modelIDs, image, "", config)
    
    	image_decode, _ := base64.StdEncoding.DecodeString(response.Data.Image)
    
    	f, err := os.Create("test.jpg")
    	f.Write(image_decode)
    
    	if err != nil {
    		log.Fatal(err)
    	}
    
    }
    

    参数名称

    参数说明

    类型

    是否必须

    modelIds

    所有用于生成图片的LoRA模型训练时的model_id。

    []string

    templateImage

    模板的URL路径。

    string

    config

    模型返回配置,默认输入nil。

    map[string]interface{}

  • 响应结果解析:

    服务返回的是一个 AIGCImageCreateResponse对象,对象字段如下:

    参数名称

    参数说明

    类型

    RequestId

    请求流水号。

    string

    Code

    请求状态码,是否完成,OK或者error。

    string

    Message

    请求状态详细信息,成功为success,其他视具体返回内容。

    string

    Data

    返回数据详情。

    AIGCImageCreateData

    data 类型 AIGCImageCreateData的字段说明:

    参数名称

    参数说明

    类型

    CostTime

    生成花费时间。

    Float

    Image

    图片base64。

    String

  • 相关错误码说明

    1. 请求服务错误码如下:

      HTTP状态码

      code

      message

      说明

      400

      PARAMETER_ERROR

      not found appid

      appId填写错误。

      400

      EXCEEDED_QUOTA_ERROR

      exceeded quota

      账户调用次数额度用完。

      401

      PARAMETER_ERROR

      sign error

      token填写错误。

      404

      PARAMETER_ERROR

      model not found

      对应模型服务未部署。

    2. 结果查询错误码如下:

      HTTP状态码

      code

      message

      说明

      462

      error

      Invalid input data. Please check the input dict.

      输入数据解析错误。

      462

      error

      Image not provided. Please check the template_image.

      并未提供写真制作的模板图片。

      462

      error

      Prompts get error. Please check the model_id.

      检查提供的model_id格式。

      462

      error

      Roop image decord error. Pleace check the user's lora is trained or not.

      Roop图像不存在,请检查是否模型是否训练。

      462

      error

      Template image decord error. Please Give a new template.

      模板图片解码错误,请给一张新的模板。

      462

      error

      There is not face in template. Please Give a new template.

      模板图像不存在人脸,请给一个新的模板。

      462

      error

      Template image process error. Please Give a new template.

      模板图片预处理错误,请给一张新的模板。

      469

      error

      First Face Fusion Error, Can't get face in template image.

      第一次人脸融合出错。

      469

      error

      First Stable Diffusion Process error. Check the webui status.

      第一次Stable Diffusion处理出错。

      469

      error

      Second Face Fusion Error, Can't get face in template image.

      第二次人脸融合出错。

      469

      error

      Second Stable Diffusion Process error. Check the webui status.

      第二次Stable Diffusion处理出错。

      469

      error

      Please confirm if the number of faces in the template corresponds to the user ID.

      请检查所给的user id数量与人脸数量是否相符。

      469

      error

      Third Stable Diffusion Process error. Check the webui status.

      背景处理出错,请更换模板。

      500

      error

      Face id image decord error. Pleace check the user's lora is trained or not.

      Face id图片解码异常,请检查是否模型是否训练。

端到端流程示例代码

  • 常规链路(SD15)

    package main
    
    import (
    	"encoding/base64"
    	"fmt"
    	"log"
    	"os"
    	"time"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    	images := []string{"https://train/0.jpg","https://train/1.jpg","https://train/2.jpg","https://train/3.jpg"}
    		
    	trainresponse, err := client.AIGCApi.AigcImagesTrain(images, "", nil)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	jobId := trainresponse.Data.JobId
    	modelId := trainresponse.Data.ModelId
    	fmt.Println(jobId)
    
    	jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    	fmt.Println(jobResponse.Data.Job.Message)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	for {
    		jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    		fmt.Println(jobResponse.Data.Job.Result)
    		if err != nil {
    			log.Fatal("get job fail", err)
    		}
    
    		if jobResponse.Data.Job.State == sdk.JOB_STATE_WAIT {
    			fmt.Println("job running")
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_SUCCESS { // job success
    			fmt.Println(jobResponse)
    			fmt.Println("job success")
    			break
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_FAILED {
    			log.Fatal("job fail", err)
    			return
    		}
    
    		time.Sleep(30 * time.Second)
    
    	}
    	fmt.Println(modelId)
    
    	templateimage := "https://template_case.png"
    
    	config := make(map[string]interface{}, 10)
    	config["lora_weights"] = 0.9
    	config["first_denoising_strength"] = 1
    	config["second_denoising_strength"] = 1
    	config["more_like_me"] = 1
    	config["crop_face_preprocess"] = false
    	config["apply_face_fusion_before"] = false
    	config["apply_face_fusion_after"] = false
    	config["color_shift_middle"] = false
    	config["color_shift_last"] = false
    	config["background_restore"] = true
    
    	createresponse, err := client.AIGCApi.AigcImagesCreate(modelId, templateimage, "", config)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	image_decode, _ := base64.StdEncoding.DecodeString(createresponse.Data.Image)
    
    	f, err := os.Create("test.jpg")
    	f.Write(image_decode)
    
    	if err != nil {
    		log.Fatal(err)
    	}
    }
    

    参数名称

    参数说明

    类型

    是否必须

    images

    训练的图片URL列表。

    []string

    templateImage

    模板的URL路径。

    string

    config

    模型返回配置,默认输入nil。

    map[string]interface{}

  • 常规链路(SDXL)

    package main
    
    import (
    	"encoding/base64"
    	"fmt"
    	"log"
    	"os"
    	"time"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    	images := []string{"https://xxx/0.jpg",
          							 "https://xxx/1.jpg",
                         "https://xxx/2.jpg")
                         
    	trainresponse, err := client.AIGCApi.AigcImagesTrain(images, "train_xl", nil)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	jobId := trainresponse.Data.JobId
    	modelId := trainresponse.Data.ModelId
    	fmt.Println(jobId)
    
    	jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    	fmt.Println(jobResponse.Data.Job.Message)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	for {
    		jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    		fmt.Println(jobResponse.Data.Job.Result)
    		if err != nil {
    			log.Fatal("get job fail", err)
    		}
    
    		if jobResponse.Data.Job.State == sdk.JOB_STATE_WAIT {
    			fmt.Println("job running")
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_SUCCESS { // job success
    			fmt.Println(jobResponse)
    			fmt.Println("job success")
    			break
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_FAILED {
    			log.Fatal("job fail", err)
    			return
    		}
    
    		time.Sleep(30 * time.Second)
    
    	}
    	fmt.Println(modelId)
    
    	template_image = "https://demo.jpg"
    
    	config := make(map[string]interface{}, 10)
    
    	createresponse, err := client.AIGCApi.AigcImagesCreate(modelId, templateimage, "create_xl", config)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	image_decode, _ := base64.StdEncoding.DecodeString(createresponse.Data.Image)
    
    	f, err := os.Create("test.jpg")
    	f.Write(image_decode)
    
    	if err != nil {
    		log.Fatal(err)
    	}
    }
    

    参数名称

    参数说明

    类型

    是否必须

    images

    训练的图片URL列表。

    []string

    templateImage

    模板的URL路径。

    string

    config

    模型返回配置,默认输入nil。

    map[string]interface{}

  • 无需训练,通过单参考图制作链路

    package main
    
    import (
    	"encoding/base64"
    	"log"
    	"os"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    
    	template_image = "https://demo.jpg"
      ref_image = "https://reference.jpg"
      
    	config := make(map[string]interface{}, 10)
    	config["ipa_control_only"] = true
    	config["ipa_weight"] = 0.6
    	config["ipa_image_path"] = ref_image
    
    	createresponse, err := client.AIGCApi.AigcImagesCreate("", templateimage, "", config)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	image_decode, _ := base64.StdEncoding.DecodeString(createresponse.Data.Image)
    
    	f, err := os.Create("test.jpg")
    	f.Write(image_decode)
    
    	if err != nil {
    		log.Fatal(err)
    	}
    }
    

    参数名称

    参数说明

    类型

    是否必须

    template_image

    模板的URL路径。

    string

    ref_image

    参考图片的URL路径。

    string

    config

    模型返回配置,默认输入nil。

    map[string]interface{}

  • 无需模板,通过提示词生成模板制作链路

    package main
    
    import (
    	"encoding/base64"
    	"fmt"
    	"log"
    	"os"
    	"time"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    	images := []string{"https://xxx/0.jpg",
          							 "https://xxx/1.jpg",
                         "https://xxx/2.jpg")
    	trainresponse, err := client.AIGCApi.AigcImagesTrain(images, "", nil)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	jobId := trainresponse.Data.JobId
    	modelId := trainresponse.Data.ModelId
    	fmt.Println(jobId)
    
    	jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    	fmt.Println(jobResponse.Data.Job.Message)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	for {
    		jobResponse, err := client.JobApi.GetAsyncJobWithId(jobId)
    		fmt.Println(jobResponse.Data.Job.Result)
    		if err != nil {
    			log.Fatal("get job fail", err)
    		}
    
    		if jobResponse.Data.Job.State == sdk.JOB_STATE_WAIT {
    			fmt.Println("job running")
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_SUCCESS { // job success
    			fmt.Println(jobResponse)
    			fmt.Println("job success")
    			break
    		} else if jobResponse.Data.Job.State == sdk.JOB_STATE_FAILED {
    			log.Fatal("job fail", err)
    			return
    		}
    
    		time.Sleep(30 * time.Second)
    
    	}
    	fmt.Println(modelId)
    
    	template_image = "https://demo.jpg"
    
    	t2i_prompt := "(portrait:1.5), 1girl, bokeh, bouquet, brown_hair, cloud, flower, hairband, hydrangea, lips, long_hair, outdoors, sunlight, white_flower, white_rose, green sweater, sweater, (cloth:1.0), (best quality), (realistic, photo-realistic:1.3), film photography, minor acne, (portrait:1.1), (indirect lighting), extremely detailed CG unity 8k wallpaper, huge filesize, best quality, realistic, photo-realistic, ultra high res, raw photo, put on makeup"
    
    	config := make(map[string]interface{}, 10)
    	config["t2i_prompt"] = t2i_prompt
    
    	createresponse, err := client.AIGCApi.AigcImagesCreate(modelId, templateimage, "", config)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	image_decode, _ := base64.StdEncoding.DecodeString(createresponse.Data.Image)
    
    	f, err := os.Create("test.jpg")
    	f.Write(image_decode)
    
    	if err != nil {
    		log.Fatal(err)
    	}
    }
    

    参数名称

    参数说明

    类型

    是否必须

    images

    训练LoRA的图片列表。

    []string

    template_image

    模板的URL路径。

    string

    t2i_prompt

    prompt 提示词。

    string

    config

    模型返回配置,默认输入nil。

    map[string]interface{}

  • 无需模板与训练,通过提示词与单参考图生成模板制作链路

    package main
    
    import (
    	"encoding/base64"
    	"log"
    	"os"
    
    	sdk "github.com/aliyun/aliyun-pai-aiservice-go-sdk"
    )
    
    func main() {
    	host := os.Getenv("Host")
    	appId := os.Getenv("AppId")
    	token := os.Getenv("Token")
    
    	client := sdk.NewClient(host, appId, token)
    
    	template_image = "https://demo.jpg"
      ref_image = "https://reference.jpg"
      
    	t2i_prompt := "(portrait:1.5), 1girl, bokeh, bouquet, brown_hair, cloud, flower, hairband, hydrangea, lips, long_hair, outdoors, sunlight, white_flower, white_rose, green sweater, sweater, (cloth:1.0), (best quality), (realistic, photo-realistic:1.3), film photography, minor acne, (portrait:1.1), (indirect lighting), extremely detailed CG unity 8k wallpaper, huge filesize, best quality, realistic, photo-realistic, ultra high res, raw photo, put on makeup"
    
    	config := make(map[string]interface{}, 10)
    	config["ipa_control_only"] = true
    	config["ipa_weight"] = 0.6
    	config["ipa_image_path"] = ref_image
    	config["t2i_prompt"] = t2i_prompt
    
    	createresponse, err := client.AIGCApi.AigcImagesCreate("", templateimage, "", config)
    	if err != nil {
    		log.Fatal(err)
    	}
    
    	image_decode, _ := base64.StdEncoding.DecodeString(createresponse.Data.Image)
    
    	f, err := os.Create("test.jpg")
    	f.Write(image_decode)
    
    	if err != nil {
    		log.Fatal(err)
    	}
    }
    

    参数名称

    参数说明

    类型

    是否必须

    ref_image

    参考图片的URL路径。

    string

    template_image

    模板的URL路径。

    string

    t2i_prompt

    prompt 提示词。

    string

    config

    模型返回配置,默认输入nil。

    map[string]interface{}

相关文档

更多详细内容,请参见Go SDK github 开源代码库