ack-node-repairer

当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

部署和使用跨可用区实例

同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...

高效基因序列检索助力快速分析肺炎病毒

云原生数据仓库AnalyticDB MySQL版 是云端托管的PB级高并发低延时数据仓库,通过 AnalyticDB MySQL版 向量检索功能构建的基因检索系统,支持毫秒级针对10亿级别的向量数据进行查询分析,更加快速、高效的为肺炎病毒防控、研发治疗药物以及...

围绕混沌工程的平台实践

基于监控指标的自动恢复,如果指标触发了恢复规则,系统会自动执行演练恢复操作。基于演练时长的自动恢复。更多信息 关于AHAS Chaos的更多信息,请参见 Chaos Engineering的历史、原则以及实践 和 混沌工程实践经验:如何让系统在生产环境...

阿里云大模型RAG对话系统最佳实践

在响应用户查询时,RAG对话系统首先利用检索系统从知识库中检索相关内容,然后将检索到的内容与原始查询一同输入大语言模型(LLM),无需重新训练LLM模型就能够获取最新的信息,并产生可靠的输出。RAG对话系统特别适用于问答、摘要生成和...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

集群变更概述

同时,您还可以通过控制台的切流操作,将出现故障的可用区隔离,此时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。更多内容请参见 部署和使用跨可用区实例。迁移可用区节点 在升配集群的过程中,您可能遇到可用区规格...

强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

倒排索引介绍

它是文档检索系统中最常用的数据结构。通过倒排索引,可以快速定位单词所在的文档列表以及该词在文档中的位置,词频等信息。供信息分析使用。倒排索引存储信息 信息名称 描述 ttf 全称:total term frequency,表示检索词在所有文档中出现的...

引擎简介

文本检索 例如商品信息检索场景,一般会保存大量商品文本信息,希望通过某个指定短语检索查询符合条件的商品。服务开通 如何开通搜索引擎,具体请参见 开通指南。使用指南 搜索引擎支持标准SQL访问,同时支持Web式操作,具体操作请参见 ...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

混合检索使用指南

业界在解决混合查询的问题时,一般采用两个系统,结构化数据存在数据库中,非结构化数据存在向量检索系统中;然后对两个系统求交集后再聚合得到最终的结果。这种方法一般先采用向量检索系统取出经过放大的amp(放大系数)*topk个结果,然后...

网站耗资源的原因及解决方法

1,1 while not rs.eof response.write rs("id")&"="&rs("name")rs.movenext wend%>ACCESS数据库的容量比较大 如果网站采用ACCESS数据库,当数据库的容量比较大时(比如超过100M以上),性能就可能会出现问题,所以访问量大的网站一般都采用...

东软案例

企业面向客户、合作伙伴和内部员工建设IT系统及应用复杂度和数量随着产品智能、互联化的深入持续增长,对映可用性保障运维监控采集数据采集种类,以及需要存储的数据量同步激增,现有监控系统基于RRD数据库或关系数据库搭建的单模引擎的...

倒排索引介绍

它是文档检索系统中最常用的数据结构。通过倒排索引,可以快速定位单词所在的文档列表以及该词在文档中的位置,词频等信息。供信息分析使用。倒排索引存储信息 信息名称 描述 ttf 全称:total term frequency,表示检索词在所有文档中出现的...

上传企业知识

本模块为您讲解如何将企业知识内容上传到系统中,由模型学习后并解答出对应的答案内容。第一步:导入企业知识 首次上传文件,点击 上传企业知识 按钮,进入上传文件页面。第二步:上传文件 选择需要模型学习的文件,上传后点击 确认导入 ...

进入Linux系统的单用户模式

在某些特殊场景下(例如排查Linux实例启动故障、修复系统异常、维护硬盘分区或root用户被锁定,需要修改密码),您可以通过Linux系统系统引导器...说明 您也可以通过卸载系统盘功能来排查启动故障问题,具体操作,请参见 卸载或挂载系统盘。

查看集群概况

智能运维系统通过红黄绿3种颜色来展示集群的健康状况:红色:表示集群已经出现了很严重的问题或者很严重的隐患,已经影响了您的使用,需要立即处理,否则存在数据丢失,集群故障问题。黄色:表示集群存在较严重的问题或隐患,可能...

错误码说明

API推送数据错误 错误码 处理方式 1000 一般为超时引起,重试后查看是否还会出现。如仍有报错,请提交工单,值班人员会尽快排查处理。3001 文档不能为空 3004 保存文档失败 3008 请求过于频繁 3011 在配置RDS或MYSQL数据源后,不支持API推...

使用向量检索插件(aliyun-knn)

向量检索插件是阿里云Elasticsearch团队自主开发的向量检索引擎插件,基于阿里巴巴达摩院proxima向量检索库实现,能够帮助您快速实现图像搜索、视频指纹采样、人脸识别、语音识别和商品推荐等向量检索场景的需求。本文介绍如何使用向量检索...

常见报错

主日志报错:all shards failed 报错说明 出现该报错后,集群会出现以下问题:读取请求无法从分片获得响应。由于集群或节点仍处于初始启动过程,导致无法搜索数据。分片丢失或处于恢复模式,并且集群状态为red。报错原因 可能原因如下:...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

设计原则

在数据中心或服务器出现故障或灾难时,能够快速恢复数据并保持业务的正常运行,可以最大程度地减少因数据丢失或损毁而对企业造成的影响;数据容灾可以提高企业的安全性和可信度。对于一些重要的数据和业务,通过实施数据容灾措施,可以保障...

GxP欧盟附录11标准合规包

16.1 为了提供支持关键过程的计算机化系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...

2023年

无 缺陷修复 修复智能诊断功能统计表大小时可能会出现数字溢出的问题,现已将统计表大小的列由integer数据类型修改为bigint数据类型。修复分区表UPDATE分布键列时出现 tuple already updated by self 错误信息的问题。修复Master节点不回收...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就系统判断为失败。...

常见问题

在确认输入数据和系统运行没有问题之外,那么可能就是原始输入doc表的数据问题,Proxima CE默认采用的是hnsw算法构建索引,可能出现了构图不连通的极端情况,导致检索召回结果数量不够。解决方法:可以通过降低recall。该方法解决不彻底,...

开放搜索OpenSearch向量检索

为了满足更多元化、更复杂的多模态检索场景,开放搜索推出向量检索功能,可以一站式完成高性能向量检索系统的搭建。2.开放搜索实例创建 步骤1:点击 立即购买 步骤2:配置实例规格参数 配置说明:商品类型:后付费(测试期间可使用后付费)...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

Pod诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

可观测性的设计原则

监控系统的指标可以让组织了解系统的健康状况和性能情况,以便在系统出现异常时快速发现问题。监控指标可以通过监控工具来实现,并允许在发生异常时发送警报。有很多监控工具可以使用,例如Prometheus、Grafana、Zabbix等,以及阿里云提供...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

快速入门

当您使用阿里云Elasticsearch时,系统会为您自动开通高级监控报警服务,并将您账号下的存量和新购Elasticsearch实例接入监控报警服务。本文为您介绍如何查看与配置可视化监控,以及如何配置日志报警规则和指标报警规则。背景信息 高级监控...

服务介绍

Search服务用来解决复杂的多维查询和全文检索。Solr是构建在Apache Lucene上的企业级搜索平台,是分布式全文检索的最佳实践之一,支持各种复杂的条件查询和全文检索,具有广泛的用户基础。通过深度融合HBase与Solr,我们推出了既能满足大...

召回引擎版介绍

​ 在线系统 在线系统是一个分布式检索系统,由三个角色构成:admin、qrs和searcher,下面分别介绍:HA Admin HA Admin是在线系统的大脑,每个物理集群都会有最少一个admin。HA admin负载接受管控系统的命令,并根据命令向Qrs和Searcher...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
Web应用防火墙 商标服务 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用