LLM-特殊字符占比过滤(DLC)

LLM-特殊字符占比过滤(DLC)组件主要用于根据特殊字符过滤样本中的占比,保留在指定比例范围内的样本。输入的OSS数据文件(JSONL格式,示例)需符合:每一行是一个合法的JSON对象,文件由多行JSON对象组成,整个文件本身不是合法的JSON...

LLM-特殊字符占比过滤(MaxCompute)

LLM-特殊字符占比过滤组件主要用于大语言模型(LLM)的文本数据预处理工作,根据特殊字符占比过滤样本,保留特殊字符个数占文本总长度比例在指定范围内的样本。使用限制 仅支持MaxCompute计算引擎。算法简介 遍历文本中的每个字符,并统计...

搜索结果摘要

一般文档内容会比较长,而在实际展示搜索结果的时候,不可能完全展示出来。这时候就需要做摘要及飘红设置。系统会截取包含搜索结果的...如果需要显示特殊字符,可以设置自定义子句kvpairs=filter_punc:0以跳过特殊字符过滤。摘要飘红效果展示

搜索结果摘要

一般文档内容会比较长,而在实际展示搜索结果的时候,不可能完全展示出来。这时候就需要做摘要及飘红设置。系统会截取包含搜索结果的...如果需要显示特殊字符,可以设置自定义子句kvpairs=filter_punc:0以跳过特殊字符过滤。摘要飘红效果展示

LiveTail

过滤字符串 您可以在 过滤条件 文本框中设置需要包含的一个或多个字符串。设置完成后,监控列表只显示包含设置的字符串的日志。过滤字段 您可以在 字段过滤 下拉列表中设置需要过滤的一个或多个字段。设置完成后,监控列表不显示设置的过滤...

字段过滤

过滤器可以过滤字符类、数值类和日期类的数据。字符类 您可以通过设置过滤器将直辖市从省份字段里过滤出来。以过滤直辖市为例 在 过滤器 区域的 省份 字段右侧单击 图标,设置过滤范围。根据需要设置过滤器。配置项 说明 示例 过滤方式 ...

上下文查询

开发人员无需登录服务器,在大量日志中通过关键字检索日志,日志服务支持通过控制台查看...在 过滤 文本框中设置过滤字符串,可实现日志列表中只显示包含过滤字符串的日志。在 高亮 文本框中设置需要高亮显示的字符串,可实现字符串标黄显示。

配置图表数据

过滤器可以过滤字符类、数值类和日期类的数据。字符类 您可以设置过滤器,把直辖市从省份字段里过滤出来。以过滤省份为例:在 过滤器 区域的 省份 字段右侧单击 图标,设置过滤范围。根据需要设置过滤器。配置项 说明 示例 过滤方式 支持 ...

LLM-计数过滤(DLC)

LLM-计数过滤(DLC)组件主要用于根据数字和字母字符比例过滤样本。输入的OSS数据文件(JSONL格式,示例)需符合:每一行是一个合法的JSON对象,文件由多行JSON对象组成,整个文件本身不是合法的JSON对象。支持的 计算资源 DLC 算法说明 ...

Quick BI过滤器设置维度值不为空时报表中不生效

问题描述 Quick BI过滤器设置维度值不为空时,报表中不生效...问题原因 数据集中的空值处理是‘’空文本字符过滤条件中不为空是对应NULL字符值的。解决方案 设置过滤器中,将过滤条件设置为‘非空文本’。适用于 Quick BI 公共云专业版4.3.1

CDNTriggerConfig

名称 类型 描述 示例值 object CDN 触发器配置 eventName string 触发事件名称,详情请参考 CDN 事件定义 CdnDomainStarted eventVersion string 触发事件...string 事件过滤关键字符串。filter-key notes string 触发器描述 缓存事件触发器

CDNEventsTriggerConfig

名称 类型 描述 示例值 object CDN 事件触发器配置。eventName string 选择一个触发事件类型。如何选择触发事件类型,请参见 CDN 事件定义。CdnDomainStarted eventVersion string 触发事件的版本号...string 事件过滤关键字符串。filter-key

字典编码(公测)

云原生数据仓库AnalyticDB PostgreSQL版 Beam存储引擎提供的字典编码功能,可以将低基数的字符串类型数据压缩为整型数据,提升存储效率,加速过滤、聚合等类型查询的性能。注意事项 仅存储弹性模式 v7.0.x版本 支持Beam字典编码功能。字典...

MNSTopicTriggerConfig

只有收到包含了此处设置的过滤标签字符串的消息时,才会触发函数执行。serverless notifyContentFormat string 触发事件的内容格式,目前支持如下两种格式:JSON STREAM 说明 默认格式为 STREAM。JSON notifyStrategy string 重试策略。...

提取字符串动态键值对

默认无 e_regex 组合自定义正则表达式和默认字符过滤 完全自定义 自定义 自定义 大部分键值对的提取使用 e_kv 函数并配置特定参数就可以很好地满足,尤其是带括字符和反斜杠需要提取并转义时。其他复杂或高级的场景可以用 e_regex 函数来...

实时同步能力说明

您可以对输入的数据源进行 数据过滤字符串替换 和 数据脱敏 处理,再将处理后的数据输出至目标数据库。数据过滤:可以对数据进行规则过滤,例如过滤字段的大小等,符合规则的数据才会被保留。字符串替换:可以通过字符串替换节点替换字符...

LLM-计数过滤(MaxCompute)

算法简介 LLM-计数过滤组件支持以下功能:根据数字字符个数或比例过滤 统计文本中的数字字符的个数,根据阈值过滤样本。或者根据字符个数占总文本长度的比例过滤样本。如果指定文本分隔符,则根据分隔符拆分文本,并以单词为单位进行统计。...

Fn:Jq

调用内部函数Fn:Jq,支持Jq功能,获取满足过滤条件后的JSON字符串。函数声明 JSON {"Fn:Jq":[method,script,object]} YAML 完整函数的语法。Fn:Jq:method,script,object 缩写形式。Jq[method,script,object]参数信息 method:必选,字符串...

查询字符串排序

假设您有一个电子商务网站,用户可以通过查询字符串来过滤商品列表。以下是两个有相同参数但顺序不同的URL请求例子:...

图片新增

说明 字符串类型属性与图片查询时的过滤条件组合使用,以起到过滤查询的功能。请参考 条件过滤。否 字符串属性 StrAttr2 字符串类型属性。最多支持128个字符。用于查询时过滤。说明 字符串类型属性与图片查询时的过滤条件组合使用,以起到...

数据源过滤条件(RDS/PolarDB)

字符类型的过滤:field_string='a' 或 field_string!'b' 注,写单引号、双引号或者不写引号均可;以下举例值为空和null的写法:field='' field!'' field<>'' field='null' field='NULL' field!'null' field!'NULL' field<>'null' field<>'...

数据源过滤条件(RDS/PolarDB)

字符类型的过滤:field_string='a' 或 field_string!'b' 注,写单引号、双引号或者不写引号均可;以下举例值为空和null的写法:field='' field!'' field<>'' field='null' field='NULL' field!'null' field!'NULL' field<>'null' field<>'...

消息过滤

Tag标签过滤规则 Tag标签过滤为精准字符串匹配,过滤规则设置格式如下:单Tag匹配:过滤表达式为目标Tag。表示只有消息标签为指定目标Tag的消息符合匹配条件,会被发送给消费者。多Tag匹配:多个Tag之间为或的关系,不同Tag间使用两个竖线...

接口出参

(@.key rlike 'regexpr')]字符串类型正则匹配过滤,正则语法为jdk,支持not rlike。例如$.menu.items?(@.label rlike 'Copy([A-Z]+)')]返回结果是长度为1的数组,第1个元素为 {"id":12,"label":"Copy SVG"};menu.items?(@.label not rlike...

接口出参

(@.key rlike 'regexpr')]字符串类型正则匹配过滤,正则语法为jdk,支持not rlike。例如$.menu.items?(@.label rlike 'Copy([A-Z]+)')]返回结果是长度为1的数组,第1个元素为 {"id":12,"label":"Copy SVG"};menu.items?(@.label not rlike...

批量操作

说明 字符串类型属性与图片查询时的过滤条件组合使用,以起到过滤查询的功能。请参考 条件过滤。Crop Boolean 否 是否进行主体识别。默认为true。true:系统自动进行主体识别,以识别的主体进行搜索。false:不进行主体识别,以整张图进行...

图像上传

说明 字符串类型属性与图片查询时的过滤条件组合使用,以起到过滤查询的功能。请参考 条件过滤。Crop Boolean 否 是否进行主体识别。默认为true。true:系统自动进行主体识别,以识别的主体进行搜索。false:不进行主体识别,以整张图进行...

迁移实施

注意事项 使用在线迁移服务迁移数据时需要注意以下事项:创建源数据地址和目的数据地址时,待迁移目录 请使用绝对路径,必须以正斜线(/)开头和结尾,不支持环境变量和特殊字符。创建源数据地址和目的数据地址时,需确保 待迁移目录 存在...

迁移实施

例如2个文件 picture.jpg 和 picture.png,设置一条包含规则过滤.*\.jpg$,此时只会迁移 picture.jpg 文件,如果同时也设置了包含规则过滤.*\.png$,则2个文件都会被迁移。当过滤规则为排除时,符合规则的文件都不会被迁移,如果有多条规则...

迁移实施

例如2个文件 picture.jpg 和 picture.png,设置一条包含规则过滤.*\.jpg$,此时只会迁移 picture.jpg 文件,如果同时也设置了包含规则过滤.*\.png$,则2个文件都会被迁移。当过滤规则为排除时,符合规则的文件都不会被迁移,如果有多条规则...

迁移实施

例如2个文件 picture.jpg 和 picture.png,设置一条包含规则过滤.*\.jpg$,此时只会迁移 picture.jpg 文件,如果同时也设置了包含规则过滤.*\.png$,则2个文件都会被迁移。当过滤规则为排除时,符合规则的文件都不会被迁移,如果有多条规则...

迁移实施

例如2个文件 picture.jpg 和 picture.png,设置一条包含规则过滤.*\.jpg$,此时只会迁移 picture.jpg 文件,如果同时也设置了包含规则过滤.*\.png$,则2个文件都会被迁移。当过滤规则为排除时,符合规则的文件都不会被迁移,如果有多条规则...

迁移实施

例如2个文件 picture.jpg 和 picture.png,设置一条包含规则过滤.*\.jpg$,此时只会迁移 picture.jpg 文件,如果同时也设置了包含规则过滤.*\.png$,则2个文件都会被迁移。当过滤规则为排除时,符合规则的文件都不会被迁移,如果有多条规则...

迁移实施

例如2个文件 picture.jpg 和 picture.png,设置一条包含规则过滤.*\.jpg$,此时只会迁移 picture.jpg 文件,如果同时也设置了包含规则过滤.*\.png$,则2个文件都会被迁移。当过滤规则为排除时,符合规则的文件都不会被迁移,如果有多条规则...

配置过滤转换组件

本文为您介绍如何配置过滤转换组件。...例如,name START WITH '张' AND name END WITH '丰' 将过滤name字段起始字符为 张 结束字符为 丰 的数据。输出字段 为您展示输出字段。单击 确认,完成 过滤转换组件 的属性配置。

配置过滤转换组件

本文为您介绍如何配置过滤转换组件。...例如,name START WITH '张' AND name END WITH '丰' 将过滤name字段起始字符为 张 结束字符为 丰 的数据。输出字段 为您展示输出字段。单击 确认,完成 过滤转换组件 的属性配置。

正则表达式配置

正则表达式配置详细说明:正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。常用字符:元字符 描述[]字符范围...

正则表达式检查

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。常用字符:元字符 描述[]字符范围。匹配指定范围内的任意...

订阅关系(Subscription)

取值:TAG过滤:按照Tag字符串进行全文过滤匹配。SQL92过滤:按照SQL语法对消息属性进行过滤匹配。过滤表达式 定义:自定义的过滤规则表达式。取值:具体取值规范,请参见 过滤表达式语法规范。行为约束 订阅关系一致 云消息队列 RocketMQ ...

在DTS迁移或同步任务中配置ETL

字符串匹配条件过滤:如果name包含“hangzhou”,则丢弃这条记录:e_if(str_contains(`name`,"hangzhou"),e_drop)。按日期过滤:如果订单时间早于某个时间,则不同步:e_if(op_lt(`order_timestamp`,"2015-02-23 23:54:55"),e_drop)。按...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
机器翻译 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储
新人特惠 爆款特惠 最新活动 免费试用