百炼模型平台

更新时间:
复制为 MD 格式

接入百炼平台中的模型,在ES中通过Inference API调用AI百炼平台的模型服务。

计费说明

按量计费,仅对实际调用量计费,无调用不产生费用。

创建模型

  1. 登录阿里云Elasticsearch控制台

  2. 在左侧导航栏,单击Elasticsearch实例

  3. 进入目标实例。

    1. 在顶部菜单栏处,选择资源组和地域。

    2. Elasticsearch实例中单击目标实例ID。

  4. 在左侧导航栏,选择AI服务中心 > 模型管理

  5. 切换到百炼模型页签,单击创建,在创建百炼模型对话框中选择自动创建或者手动创建

    • 自动创建:需要输入百炼平台可用的API Key,一次性接入ES支持的所有百炼平台模型。

    • 手动创建:需要选择待接入的模型名称,输入百炼平台可用的API Key以及API Host(模型的业务空间专属域名)。

      获取相关参数,请参见获取API Key

      重要

      注意API Key、API Host与模型所在地域相关,务必确保地域信息正确。

      image

  6. 单击确定,创建成功后模型列表展示成功的模型,接下来您就可以调用模型服务。

调用示例

文本向量

# text_embedding与模型类别ID一致;bailian_embeddings 与控制台模型ID一致
POST _inference/text_embedding/bailian_embeddings 
{
  "input":[
        "风急天高猿啸哀",
        "渚清沙白鸟飞回", 
        "无边落木萧萧下", 
        "不尽长江滚滚来"
        ]
}

image

执行成功后的部分返回结果:

{
  "text_embedding": [
    {
      "embedding": [
        0.049183346,
        -0.068886764,
        0.047604065,
        -0.06778378,
        -0.009488225,
        -0.0791145,
        -0.006082115,
        0.057004552,
        ...
        ]
    }
  ]
}

稀疏向量

# sparse_embedding与模型类别ID一致;bailian_sparse_emb必须与控制台中的模型ID一致
POST _inference/sparse_embedding/bailian_sparse_emb
{
  "input": [
    "风急天高猿啸哀",
    "渚清沙白鸟飞回",
    "无边落木萧萧下",
    "不尽长江滚滚来"
  ]
}

image

执行成功后的部分返回结果:

{
  "sparse_embedding": [
    {
      "is_truncated": false,
      "embedding": {
        "35727": 0.897,
        "44636": 1.3828,
        "99208": 1.998,
        "99508": 2.1836,
        "103000": 1.96,
        "111758": 1.9805,
        "115272": 1.7686
      }
    },
    {
      "is_truncated": false,
      "embedding": {
        "18397": 1.4033,
        "79766": 2.0566,
        "99243": 1.2812,
        "99617": 1.3809,
        "99723": 1.1973,
        "100462": 1.4648,
        "119294": 1.9326
      }
    },
   {
      ...
      }
    }
  ]
}

文本排序

# rerank与模型类别ID一致;bailian_rerank必须与控制台中的模型ID一致
POST _inference/rerank/bailian_rerank
{
  "input": [
    "文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序",
    "量子计算是计算科学的一个前沿领域",
    "预训练语言模型的发展给文本排序模型带来了新的进展"
  ],
  "query": "什么是文本排序模型"
}

image

执行成功后的返回结果:

{
  "rerank": [
    {
      "index": 0,
      "relevance_score": 0.9290283
    },
    {
      "index": 2,
      "relevance_score": 0.7562483
    },
    {
      "index": 1,
      "relevance_score": 0.31665403
    }
  ]
}

多模态向量

# multi_modal_embedding与模型类别ID一致;bailian_mm必须与控制台中的模型ID一致
POST _inference/multi_modal_embedding/bailian_mm
{
  "input":"""
    {"text":"多模态向量模型"},
    {"image":"https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"},
    {"video":"https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250107/lbcemt/new+video.mp4"},
    {"multi_images":[
      "https://img.alicdn.com/imgextra/i2/O1CN019eO00F1HDdlU4Syj5_!!6000000000724-2-tps-2476-1158.png",
      "https://img.alicdn.com/imgextra/i2/O1CN01dSYhpw1nSoamp31CD_!!6000000005089-2-tps-1765-1639.png"
    ]}
    """
}

image

执行成功后的部分返回结果:

{
  "text_embedding": [
    {
      "embedding": [
        -0.014518738,
        -0.014297485,
        -0.056121826,
        0.043823242,
        0.01889038,
        0.04547119,
        ...
        ]
    }
  ]
}

Chat(对话)

# completion与模型类别ID一致;bailian_deepseek必须与控制台中的模型ID一致
POST _inference/completion/bailian_deepseek
{
  "input":"你是谁"
}

image

执行成功后的返回结果:

{
  "completion": [
    {
      "result": "你好!我是通义千问(Qwen),阿里巴巴集团旗下的超大规模语言模型。我能够回答问题、创作文字,比如写故事、写公文、写邮件、写剧本、逻辑推理、编程等等,还能表达观点,玩游戏等。如果你有任何问题或需要帮助,欢迎随时告诉我!"
    }
  ]
}