词向量(文娱)

词向量(高级版-文娱领域)

调用须知

  • 该服务为高级版的能力,需要开通高级版才能免费调用。点击这里确认开通状态:点击确认开通

  • 支持语言:中文

  • 支持领域:文娱领域

  • 能力说明:词向量是一种简单有效的将最小语义单元 —— 词转化为数值表示的方法。通过词向量得到的数值表示的形式是高维稠密向量。这种数值表示的特点是语义相近的词(如“红色”和“蓝色”)在向量空间中的位置接近。这种数值表示可以支撑语义相似度计算等具体应用。

请求参数

名称

类型

是否必选

示例值

描述

Action

String

GetWeChEntertainment

系统规定参数,取值:GetWeChEntertainment

ServiceCode

String

alinlp

固定值,只支持alinlp

Text

String

请输入文本

需要分析的文本,最大长度1024个字符

TokenizerId

String

YOUKU

固定值,YOUKU

Size

String

50

词向量维度,支持50,100,200

Type

String

word

分析文本的切分方式。支持以下几种:

  • “word”表示将句子切成词

  • “char_unigram”表示将句子切成字

  • “char_bigram”表示将句子切成双字

Operation

String

none

句子表示方法

  • “none”给句子中的每个词一个表示

  • “max”用按维度取最大值的方式进行句子表示

  • “average”用按维度取平均的方式进行句子表示

返回数据

名称

类型

示例值

描述

Data

String

{ “result”: { “vec”: [ 0.27376035, … (skip) … 0.26160634 ] }, “code”: 1000, “success”: true, “message”: “OK” } { “result”: [ { “vec”: [ 0.572929, … (skip) … 0.039206 ], “id”: “0”, “token”: “请” }, { “vec”: [ -1.263492, … (skip) … 2.302645 ], “id”: “1”, “token”: “输入” }, { “vec”: [ 1.511844, … (skip) … -1.557032 ], “id”: “2”, “token”: “文本” } ], “code”: 1000, “success”: true, “message”: “OK” }

如果operation为”none”,返回一个列表。

列表中的每个项是一个dict,成员包括:

  • vec -ListFloat -代表词向量

  • id -string -代表词序号

  • token -string -代表切分结果

如果operation为”max”或”average”,返回一个dict。

成员包括:

  • vec -ListFloat -代表词向量

RequestId

String

FA53D08F-37D1-4D81-BEE7-41F24E825F60

唯一请求id,排查问题的依据

示例

请求示例

http(s)://alinlp.cn-hangzhou.aliyuncs.com/?Action=GetWeChEntertainment
&ServiceCode=alinlp
&Text=请输入文本
&TokenizerId=YOUKU
&<公共请求参数>

正常返回示例

JSON 格式

{"RequestId":"FA53D08F-37D1-4D81-BEE7-41F24E825F60","Data":"{   \"result\": {     \"vec\": [       0.27376035,        ... (skip) ...       0.26160634     ]   },   \"code\": 1000,   \"success\": true,   \"message\": \"OK\"  }    {   \"result\": [     {       \"vec\": [         0.572929,         ... (skip) ...         0.039206       ],       \"id\": \"0\",       \"token\": \"请\"     },     {       \"vec\": [         -1.263492,         ... (skip) ...         2.302645       ],       \"id\": \"1\",       \"token\": \"输入\"     },     {       \"vec\": [         1.511844,         ... (skip) ...         -1.557032       ],       \"id\": \"2\",       \"token\": \"文本\"     }   ],   \"code\": 1000,   \"success\": true,   \"message\": \"OK\"  }"}

错误码

HttpCode

错误码

错误信息

描述

403

Forbidden.NoAuth

Failed to perform user authentication.

用户鉴权失败

411

FrameworkApiError

Framework API error.

框架API错误

410

FrameworkError

Framework internal server error.

框架错误

412

FrameworkFormatError

Framework request format error.

框架请求格式错误

413

FrameworkReturnError

Framework return type format error.

框架返回格式错误

406

TextCodingError

An encoding error occurred to the input text.

输入文本编码错误

405

TextLimitExceeded

The maximum length of the text is exceeded.

文本长度超过限制

429

Throttling.User

Flow control has been triggered.

触发流控

400

UserStatusInvalid

The user status is invalid.

用户状态无效,未开通服务

500

InternalError

A service error occurred.

服务内部异常

401

InvalidParameter

The parameter is invalid.

参数无效

访问错误中心查看更多错误码。

阿里云首页 自然语言处理 相关技术圈