搜索引擎线路

概述 搜索引擎是指搜索引擎爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则、自动地抓取万维网信息的程序或者脚本。应用场景 网站被搜索引擎爬虫访问会耗费服务器的流量和带宽,可通过设置 搜索引擎线路 专门指向一个服务器...

搜索引擎版本说明

为提升用户体验,云原生多模数据库 Lindorm 搜索引擎会不定期地发布版本,用于丰富云产品功能或修复已知缺陷。您可以参阅本文了解Lindorm搜索引擎的版本更新说明,选择在业务低峰期升级实例的搜索引擎版本。如何查看或升级实例的搜索引擎...

Ha3搜索引擎的审计事件

Ha3搜索引擎(SearchEngine)已与操作审计服务集成,您可以在操作审计中查询用户操作Ha3搜索引擎产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作...

通过开源Solr API访问搜索引擎

本文介绍通过开源Solr API(Java)访问Lindorm搜索引擎的步骤和示例说明。前提条件 安装Java环境,使用JDK1.6或更高版本。已将本机IP添加至白名单,具体操作,请参见 设置白名单。注意事项 不支持通过 公网 访问。步骤一:下载solr-solrj ...

通过SQL连接并使用搜索引擎

Lindorm搜索引擎支持SQL JDBC访问,本文介绍如何使用开源的Solr JDBC访问Lindorm搜索引擎。前提条件 已开通Lindorm搜索引擎,具体操作请参见 开通指南。已将客户端的IP地址加入到Lindorm实例的白名单中,具体操作,请参见 设置白名单。已...

通过curl命令连接并使用搜索引擎

Lindorm搜索引擎提供了一系列兼容Elasticsearch RESTful风格的API,您可以通过 curl 命令调用这些API,管理搜索引擎中的搜索索引及文档。前提条件 已开通搜索引擎(Elasticsearch兼容版本)。具体操作,请参见 开通指南(Elasticsearch兼容...

通过Search Shell连接并使用搜索引擎

如果您的实例类型为Lindorm单节点,请通过SQL连接并使用搜索引擎,具体操作,请参见 通过SQL连接并使用搜索引擎。操作步骤 执行下述操作前,请先切换至非Root的用户。安装Search Shell(如已安装,可跳过)。登录ECS实例,执行下述命令下载...

通过Robots协议屏蔽搜索引擎抓取网站内容

若有些页面访问消耗性能比较高,不希望被搜索引擎抓取,可以在根目录下存放robots.txt文件,屏蔽搜索引擎或者设置搜索引擎可以抓取文件范围以及规则。详细信息 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容...

通过开源Solr API(Java)访问搜索引擎

本文介绍通过开源Solr API(Java)访问Lindorm搜索引擎的步骤和示例说明。前提条件 安装Java环境,使用JDK1.6或更高版本。已将本机IP添加至白名单,具体操作,请参见 设置白名单。注意事项 不支持通过 公网 访问。步骤一:下载solr-solrj ...

Lindorm宽表引擎搜索索引和二级索引的区别

搜索索引是宽表引擎与搜索引擎深度融合的特性,需要单独开通购买,核心功能为倒排索引和列存,适合较为复杂的多维查询,能够覆盖分词、模糊查询、聚合分析、排序翻页等场景,索引列个数最多1000个。如何开通搜索索引,请参见 开通搜索索引...

增量导入

本章节介绍搜索引擎如何进行增量导入。请参见 RDS增量导入,将增量数据导入到宽表引擎中。导入宽表引擎后,后台会通过BDS服务自动将宽表引擎的增量数据同步到搜索引擎中。注意 同步到搜索引擎的数据仅限于已经配置好的schema映射。

开通指南

本章节介绍搜索引擎开通的操作步骤。前提条件 在购买搜索引擎服务之前,您需要仔细评估实例的资源容量。为了帮助您进行资源规划,我们给出一些通用的建议参考,具体请参见 集群容量规划。购买实例时开通搜索索引 登录 Lindorm管理控制台。...

引擎简介

Lindorm搜索引擎提供面向海量数据的在线搜索服务,具备高效的索引读写能力、更低成本的数据存储,并支持快速的弹性扩展,广泛应用于站内搜索、订单查询、日志分析、监控APM等场景。核心能力 低成本 支持多种高效压缩算法,有效降低索引存储...

全量导入

本章节介绍搜索引擎如何进行全量导入。请参见 RDS全量导入 将全量数据导入到宽表引擎中。将数据导入到宽表引擎后,请参见 通过构建索引完成全量数据同步,将全量数据导入到搜索引擎中。

测试环境

本次测试针对开源自建Solr搜索引擎与云Lindorm搜索引擎进行了基础场景的读写性能对比。测试使用的工具为自研的benchmark工具,如需了解该工具的详细设计,可通过Lindorm钉钉值班或者提工单联系我们。环境配置 网络类型为VPC网络,保证客户...

应用指南

用户初次接触开放搜索时可参考下图的应用指南快速了解开放搜索引擎具有的功能。

配置冷存储

云原生多模数据库 Lindorm 搜索引擎支持配置表级别的冷存储功能,可以将表数据存储至冷存储介质中,从而降低存储成本。本文介绍搜索引擎配置冷存储的具体操作。前提条件 已下载并安装Search Shell,具体操作请参见 通过Search Shell连接并...

开通指南(Elasticsearch兼容版本)

本文介绍如何开通 云原生多模数据库 Lindorm 搜索引擎Elasticsearch兼容版本以及如何查看连接地址。前提条件 云原生多模数据库 Lindorm 搜索引擎Elasticsearch兼容版本目前处于公测阶段,如需使用,请您 提交工单 进行申请,工单中需提供...

登录集群管理系统

搜索引擎提供Web方式管理集群。本文介绍通过Web方式登录搜索引擎的集群管理系统。前提条件 已创建Lindorm实例,具体操作请参见 创建实例。已将本机的外网IP添加至白名单。具体操作请参见 设置白名单。操作步骤 登录 Lindorm管理控制台。在...

更新配置集

本文介绍如何更新 云原生多模数据库 Lindorm 搜索引擎的配置集。前提条件 下载并安装Shell,具体请参见 通过Search Shell连接并使用搜索引擎。下载默认的配置集模板 执行以下命令下载默认的配置集模板_indexer_default,在其基础上进行编辑...

中文通用分析器

分析器介绍 中文通用分析器(chn_standard...比如干预“搜索引擎”的分词时,在词条中添加搜索引擎搜索引擎还会继续分词成“搜索”、“引擎”两个词。注意事项 该分析器只适用于TEXT类型字段,在配置schema的时候指定分析器为chn_standard。

Java High Level REST Client

Lindorm搜索引擎兼容Elasticsearch 7.10及更早版本的功能,如果您想要进行复杂查询分析或使用Elasticsearch的一些高级特性,可以通过Java High Level REST Client连接搜索引擎,轻松实现搜索索引及索引文档的设计和管理。前提条件 已安装...

Java Low Level REST Client

Lindorm搜索引擎兼容Elasticsearch 7.10及更早版本的功能,如果您想要自定义请求和响应处理方式,可以通过Java Low Level REST Client连接并使用搜索引擎。前提条件 已安装Java环境,要求安装JDK 1.8及以上版本。已将客户端IP地址添加至...

召回引擎版介绍

召回引擎版简介 OpenSearch-召回引擎版是阿里巴巴自主研发的大规模分布式搜索引擎,支持了淘宝、天猫、菜鸟、优酷乃至海外电商在内整个集团的搜索业务,同时也支撑了阿里云上的开放搜索业务。OpenSearch-召回引擎版经过多年的发展,在满足...

公共错误码

400 IndexSchemaInvalid index schema invalid 索引架构无效 诊断 400 QuerySearchEngineError query search engine error 查询搜索引擎错误 诊断 400 ha3.UpgradeInvalidSpec upgrade spec is invalid 升配规格无效 诊断

restful api文档搜索Demo

通过SDK 调用问天搜索引擎进行数据检索。通用代码示例 import com.aliyun.ha3engine.Client;import com.aliyun.ha3engine.models.*;import com.aliyun.tea.TeaException;import java.util.ArrayList;import java.util.HashMap;import java....

文档搜索 Demo

通过SDK 调用问天搜索引擎进行数据检索。代码示例 package main import("fmt"util"github.com/alibabacloud-go/tea-utils/service" "github.com/alibabacloud-go/tea/tea" ha3engine "github.com/aliyun/alibabacloud-ha3-go-sdk/client" )...

模糊分析器

模糊分析介绍 模糊分析器(fuzzy)适用于模糊搜索,模糊搜索是指在用户搜索意图不明确时,搜索引擎将用户的查询(query)与待检索的内容(doc)进行模糊匹配,找出与查询相关的内容。是否相关主要从两个方面衡量:一是query是doc中某些内容...

召回引擎版支持RAG方案

} } 控制台输出示例如下:split result:[{"chunk":"OpenSearch是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式商用智能搜索平台,目前为包括淘宝、天猫、菜鸟在内的阿里集团核心搜索业务提供中台服务支持。经过多年的行业搜索...

云虚拟主机被爬虫访问耗费大量流量的解决方法

说明:robots协议也叫robots.txt,robots协议不是强制协议,部分搜索引擎或者伪装成搜索引擎的爬虫不会遵守该协议,对于不遵守该协议的情况,以下方法无效。根据 更多信息 中的搜索引擎和其对应的User-Agent,Robots.txt代码样例如下所示:...

增量导入

本章节介绍搜索引擎如何进行增量导入。请参见 RDS增量导入,将增量数据导入到宽表引擎中。导入宽表引擎后,后台会通过BDS服务自动将宽表引擎的增量数据同步到搜索引擎中。重要 同步到搜索引擎的数据仅限于已经配置好的schema映射。

连接并使用实例

搜索引擎 通过solr Shell连接搜索引擎 通过Search Shell连接并使用搜索引擎 通过SQL连接搜索引擎 通过SQL连接并使用搜索引擎 文件引擎 通过HDFS Shell连接文件引擎 通过HDFS Shell连接并使用文件引擎 通过开源HDFS客户端连接文件引擎 通过...

搜索索引介绍

搜索引擎收到数据后实时构建倒排索引。数据查询的流程如下:查询操作发送至Lindorm宽表引擎,计算层自动进行查询编译,基于优化器选择合适的SearchIndex。查询重定向至搜索引擎,查询满足条件的数据。汇总搜索引擎的数据,如果需要会自动回...

查看连接地址

连接地址类型 连接方式 服务类型 网络类型 参考文档 Elasticsearch兼容地址 通过curl命令连接并使用搜索引擎(连接地址为图示中①)Lindorm 专有网络 公网 通过curl命令连接并使用搜索引擎 Solr兼容版本 查看搜索引擎的连接地址前,请确保...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
图像搜索 微服务引擎 Serverless 应用引擎 智能开放搜索 OpenSearch 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用