pg_trgm

包含关键 word 的结果被输出,并按照相似度进行了排序。查询结果如下:t|sml-+-word|1 test word|0.5 word test|0.5(3 rows)方式二:使用pg_trgm插件中的操作符实现。例如在如下查询中,查询得到测试数据与关键词之间的“距离”(相似度...

接口说明

enable_words Boolean 否 是否开启返回信息,默认为false。enable_sample_rate_adaptive Boolean 否 是否将大于16 kHz采样率的音频进行自动降采样(降为16 kHz),默认为false。enable_callback Boolean 否 是否启用回调功能,默认值为...

接口说明

enable_words Boolean 否 是否开启返回信息,默认为false,开启时需要设置version为 4.0。enable_sample_rate_adaptive Boolean 否 大于16 kHz采样率的音频是否进行自动降采样(降为16 kHz),默认为false,开启时需要设置version为 4.0...

Word2Vec

Word2Vec算法组件利用神经网络,通过训练,将映射为K维度空间向量,且支持对表示的向量进行操作并和语义相对应。输入为单词列或词汇表,输出为向量表和词汇表。使用说明 Word2Vec组件的上游需要接入 词频统计 组件。说明 词频统计的...

接口说明

关于ECS的网络类型请参见 网络类型。上海:ws:/nls-gateway-cn-shanghai-internal.aliyuncs.com:80/ws/v1 北京:ws:/nls-gateway-cn-beijing-internal.aliyuncs.com:80/ws/v1 深圳:ws:/nls-gateway-...

QueryProcessor

{"name":"stop_word","use_system_dictionary":true,"intervention_dictionary":""} 结构 字段 类型 描述 name String 功能名称-stop_word 停用-spell_check 拼写检查-term_weighting 权重-synonym 同义-category_prediction 类目...

QueryProcessor

active Boolean 是否默认规则 Processor 示例:{"name":"stop_word","use_system_dictionary":true,"intervention_dictionary":""} 结构 字段 类型 描述 name String 功能名称-stop_word 停用-spell_check 拼写检查-term_weighting ...

使用pg_jieba插件进行中文分词

词典表 jieba.jieba_custom_word 的表结构如下:CREATE TABLE jieba.jieba_custom_word(word text primary key,-自定义 weight float8 default '1.0',-权重 type text default 'x'-词性);申请权限 提交工单,在工单中申请自定义词典的...

组件参考:所有组件汇总

语义向量距离 基于算法语义向量结果(如Word2Vec生成的向量),计算给定的(或者句子)的扩展(或者扩展句),即计算其中某一向量距离最近的向量集合。其中一个用法是,基于Word2Vec生成的向量结果,根据输入的返回最为相似的...

中文分词(文娱)

产品类型修饰"]},{"id":"2","word":"文本","tags":["基本-中文","产品类型修饰"]}],"success":true } id:词序号 word: tags:语义标签 RequestId String FA53D08F-37D1-4D81-BEE7-41F24E825F60 唯一请求id,排查问题的依据 调用接...

词性标注(通用)

VC 系动词,如:是 VE 存在性动词,如:有,没{有},无 VV 其他动词 NR 专有名词 NT 时间名词 NN 其他名词 LC 方位 PN 代词 DT 限定 CD 基数 OD 序列 M 度量 AD 副词 P 介词 CC 并列连接 CS 从属连接 DEC“的”作为补语标记/...

词性标注(电商)

如:是 VE 存在性动词,如:有,没{有},无 VV 其他动词 NR 专有名词 NT 时间名词 NN 其他名词 LC 方位 PN 代词 DT 限定 CD 基数 OD 序列 M 度量 AD 副词 P 介词 CC 并列连接 CS 从属连接 DEC“的”作为补语标记/名词化标记...

中文分词(O2O)

["基本-中文","产品类型修饰"]},{"id":"2","word":"文本","tags":["基本-中文","产品类型修饰"]}],"success":true } id:词序号 word: tags:语义标签 RequestId String FA53D08F-37D1-4D81-BEE7-41F24E825F60 唯一请求id,排查...

中文分词(通用)

{"id":"1","word":"输入","tags":["基本-中文","产品类型修饰"]},{"id":"2","word":"文本","tags":["基本-中文","产品类型修饰"]}],"success":true } id:词序号 word: tags:语义标签 RequestId String FA53D08F-37D1-4D81-BEE7-...

中文分词(电商评价)

中文","产品类型修饰"]},{"id":"2","word":"文本","tags":["基本-中文","产品类型修饰"]}],"success":true } id:词序号 word: tags:语义标签 RequestId String FA53D08F-37D1-4D81-BEE7-41F24E825F60 唯一请求id,排查问题的依据 ...

中文分词(基础版)

tags":["基本-中文","产品类型修饰"]},{"id":"2","word":"文本","tags":["基本-中文","产品类型修饰"]}],"success":true } id:词序号 word: tags:语义标签 RequestId String FA53D08F-37D1-4D81-BEE7-41F24E825F60 唯一请求id,...

中文分词(电商内容)

大粒度,1:中粒度(默认),2:小粒度 返回数据 名称 类型 示例值 描述 Data String {"result":[{"id":"0","word":"请","tags":["基本-中文"]},{"id":"1","word":"输入","tags":["基本-中文","产品类型修饰"]},{"id":"2","word":...

中文分词(电商标题)

2:小粒度 返回数据 名称 类型 示例值 描述 Data String {"result":[{"id":"0","word":"请","tags":["基本-中文"]},{"id":"1","word":"输入","tags":["基本-中文","产品类型修饰"]},{"id":"2","word":"文本","tags":["基本-中文",...

Word

close close()方法描述 关闭word 调用样例-rpa.app.wps.word.Word.close-#注意事项:使用前需确认已安装WPS相关软件#close方法不会自动保存,建议先使用save方法保存后,再通过close方法关闭word#代码调用样例如下:word_file_path=r"D:\2_...

Word

调用样例-rpa.app.microsoft.word.Word.search-#注意事项:使用前需确认已安装MicroSoft相关软件#代码调用样例如下,会在word文档内容中找到对应关键并默认将光标移动到关键左侧:word_file_path=r"D:\2_测试文件归档\测试Word.docx...

ListInterventionDictionaryEntries-获取干预词条清单

release 新品 series 系列 marketing 营销服务 entertainment 文娱书文曲 organization 机构实体 movie 影视名称 game 游戏名称 number 数字 unit 单位 common 普通 new-word 新词 proper-noun 专有名词 symbol 符号 prefix 前缀 suffix ...

InterventionDictionaryEntry

2:相关)例:{“2”:1,”100”:0} term_weighting 权重 字段 类型 描述 tokens[]Object 权重内容 tokens[].token String term tokens[].weight int term权重,有7(权重高)、4(权重中)、1(权重低)示例 {"word":"谭浩强c语言程序...

InterventionDictionaryEntry

2:相关)例:{“2”:1,”100”:0} term_weighting 权重 字段 类型 描述 tokens[]Object 权重内容 tokens[].token String term tokens[].weight int term权重,有7(权重高)、4(权重中)、1(权重低)示例 {"word":"谭浩强c语言程序...

命名实体识别(基础版)

ECOM 模型类型,默认为ECOM 返回数据 名称 类型 示例值 描述 Data object {"result":[{"synonym":"","weight":"0.100000","tag":"普通","word":"请"},{"synonym":"","weight":"0.100000","tag":"普通","word":"输入"},{"synonym":"",...

命名实体识别(中文高级版)

LexerId String 否 ECOM 模型类型,默认为ECOM 返回数据 名称 类型 示例值 描述 Data String {"result":[{"synonym":"","weight":"0.100000","tag":"普通","word":"请"},{"synonym":"","weight":"0.100000","tag":"普通","word":"输入...

ListInterventionDictionaryNerResults-获取实体识别...

game 游戏名称 number 数字 unit 单位 common 普通 new-word 新词 proper-noun 专有名词 symbol 符号 prefix 前缀 suffix 后缀 gift 赠送 negative 否定 agent 代理 category token string 实体 豆 order integer 序号 1 tagLabel ...

Nlu-统一NLU接口

Word string 同义 天气 GlobalSensitiveWordList object[]全局敏感词列表 StandardWord string 名词 天气 Word string 同义 天气 DsNluInfo object 对话工厂的 nlu 信息 EntityList object[]实体列表 Name string 实体名称@城市 Origin...

GetAsrVocab-获取指定热组的详情信息

调用方可根据此字段来判断请求是否成功:true 表示成功 false/null表示失败 true Data object 返回结果 Name string 热组名称 test Words object[]热表 Weight integer 权重 0 Word string 热 你好 示例 正常返回示例 JSON 格式 {...

移动端SDK说明

enable_word_level_result Boolean 否 是否开启信息返回,默认false。first_channel_only Boolean 否 是否开启只处理第一个声道,默认false。获取识别结果 启动任务后一段时间(根据文件长度和网络情况而定)将收到EVENT_FILE_TRANS_...

阿里云ES实现同义动态更新

本文以新网络架构下的阿里云ES实例为例,介绍如何实现同义动态更新。背景信息 阿里云Elasticsearch配置在VPC环境下,网络可选性较小,例如公网环境下的词典无法直接加载。Elasticsearch无法直接动态加载修改的词典内容,需要结合场景开发...

文本搜索函数和操作符

这类似于一些常见的网络搜索工具的行为。websearch_to_tsquery('english','"fat rat"or cat dog')→'fat'<->'rat'|'cat'&'dog' querytree(tsquery)→text 生成 tsquery 的可转位部分的表示。结果为空或仅为 T 表示不可索引查询。querytree...

高效基因序列检索助力快速分析肺炎病毒

因此,通过上下文的关系,采用向量算法,可以为每个生成一个向量,通过计算两个向量之间的相似度,得到两个的相似度。同样的道理,基因序列的排列具有一定的规律,并且每一部分基因序列所表达的功能和含义不同。可以将很长的基因...

采集策略

网络类型:instance.network_type SLB网络类型,包括专有网络(VPC)和经典网络(Classic)。VPC ID:instance.vpc_id SLB实例所属的专有网络VPC ID。地址类型:instance.address_type SLB实例的地址类型,包括阿里云内网(intranet)和...

关键词抽取

该算法基于TextRank,根据PageRank算法思想,利用局部词汇之间关系(共现窗口)构建网络,并计算单词的重要性,最终选取权重大的作为关键。常用流程如下:原始语料 分词 使用过滤 关键抽取 组件配置 您可以使用以下任意一种方式,...

WebSocket协议说明

words Word 信息。status Integer 状态码。Word 结构:参数 类型 说明 text String 文本。startTime Integer 开始时间。endTime Integer 结束时间。示例格式如下:{"header":{"message_id":"05450bf69c53413f8d88aed1ee60*","task_id...

接口说明

vocabulary_id String 否 定制泛热ID,具体可参见 在控制台创建热。enable_voice_detection Boolean 否 是否启动语音检测。开启后能够识别出一段音频中有效语音的开始和结束,剔除噪音数据。默认值:False(不开启)。max_start_...

接口说明

words List<Word>当前句子的信息,需要将enable_words设置为true。confidence Double 当前句子识别结果的置信度,取值范围0.0~1.0,值越大表示置信度越高。EVENT_SENTENCE_END事件表示服务端检测到了一句话的结束,并返回该句话的识别...

查询数据

Java、Python SDK中都需要配置如下4个必要参数(endpoint、instance_id、access_user_name、access_pass_word):endpoint:私网/公网域名 可在实例详情页中网络信息和API入口查看:开启公网访问后可以在本地通过 公网域名(包含public的...

PyODPS概述

示例场景 用户需要通过分析每天产生的日志字符串来提取一些信息,有一个只有一列的表,类型是string,通过jieba分词可以将中文语句分词,然后再找到想要的关键存储到信息表里。低效处理代码demo import jieba t=o.get_table('word_split'...

停用过滤

本文为您介绍 Designer 提供的停用过滤算法组件。停用过滤算法组件是文本分析中的一个预处理方法,用于过滤分词结果中的噪声(例如的、是或啊)。停用过滤算法组件的两个输入桩为输入表和停用表。输入表为需要过滤停用的表。停用...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
负载均衡 共享流量包 NAT网关 弹性公网IP 高速通道 短信服务
新人特惠 爆款特惠 最新活动 免费试用